达观知识图谱赋能智能投研 可实现金融数据结构化提取与分析
目前企业用到最多的是结构化数据,也就是我们常说数据库存储的数据。在 半结构化数据和非结构化数据 (如各种办公文件、文本、图片、语音等),大多企业 只是作为知识库存档,并没有利用起来 ,这部分数据蕴含着很多有价值的信息,如何利用这些数据提炼有价值的信息成为当前企业痛点。达观知识图谱解决方案采用前沿深度学习、光学字符识别、自然语言处理等技术,可快速挖掘非结构数据和半结构数据,并找出其存在的关联关系,提炼价值信息,稳定可靠地解决该行业所面临的问题。
⚫️银行风控主要包含信贷审批、额度授信、信用反欺诈、异常交易行为发现、客户关联分析、风险定价等业务场景。
⚫️智能客服主要包含对话机器人、智能问答、智能推荐等业务场景。
⚫️智能投研包含上市公司研报、公告数据分析挖掘,企业工商信息、财报信息、董监高、产品、产业链分析挖掘等业务场景。
首先,想要构建知识图谱,要 先找到数据 。众所周知,金融机构的投研业务要依赖很多数据来分析,包含企业财报、年报、企业资讯、产品、行业、产业链、公司股东等数据。
采集完这些数据之后,我们将从海量数据中 提炼构建知识图谱的实体,这些实体包含企业、企业产品、企业所在行业、企业的股东/董监高、企业风险、竞品等。 以上实体有些是结构化数据可以直接获取到的(如企业工商信息包含很多构建知识图谱的实体),有些需要通过NLP技术来挖掘分析获取(如企业风险等)。
获取这些实体之后, 根据业务梳理各个实体间的关联关系, 定义知识图谱的边, 例如以企业(实体)为中心节点,向外发散,企业的股东有哪些,企业所属行业,企业有哪些产品/业务模式,企业竞品、竞争对手有哪些,这些都属于知识图谱中的实体关系。