我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。
随着人工智能技术的快速发展,越来越多企业引入自然语言理解(NLP)技术提高日常工作效率,本文重点介绍
NLP技术在企业舆情及风控场景上的应用
。
企业尽调工作包含商务模式调查、行业发展前景调查、管理体系及运营情况调查、公司影响力调查、核心技术、产品与市场、风险分析调查以及法律、财务调查等。此类调查分析
工作负荷大,文本信息量繁多
,以传统人工密集方式进行相当
耗时费力
。通过NLP文本理解技术赋能尽调风控,使用机器替代部分人力,可以达到
事半功倍
的效果
,下文以企业风险分析调查工作为例。
企业舆情风控调查主要是分析目标企业经营过程中,是否有不利于该企业发展的负面影响。互联网上的新闻资讯是一个比较好的风险预警渠道,成千上万的媒体网站及官方渠道,经常会发布一些对于上市公司/发债主体等企业的资讯,数据即时更新。若是以人力搜集这些信息,实在力所不及,且无法达到及时预警的效果,机器则可以!
- 公开数据采集:可根据诉求进行互联网数据采集,收集数据。
- 数据加工:垃圾数据过滤、去重、NLP标签(一整套风险标签体系)、数据整合等。
- 智能搜索(舆情产品):企业风险预警、标签搜索、语义搜索、重大事件分析等。
采集工具对互联网上的网站、论坛、微博,以及微信公众号公开数据进行搜集,经过数据去重、相似度加权计算、数据降噪等技术手段,对采集上来的数据进行清洗,然后引入NLP技术对清洗后的数据进行加工(分词、依存关系提取、命名实体识别、语义归一等),生成风险识别模型、情感分析模型、实体识别模型等标签提取模型,最后体现到达观舆情风控产品应用上,主要包含
事件分析和资讯分析
两大类。事件分析包含热门事件、事件脉络、事件源头、事件追溯、事件趋势等分析;
事件脉络
事件追溯
资讯分析包含一整套资讯标签体系,主要包含情感分析、上市公司/发债主体公司标签、风险标签等。资讯包含上市公司、发债主体的互联网公开数据,对资讯进行打标签,效果如下:
企业舆情尽调的痛点:预警相对滞后,缺乏系统机制。互联网传播速度快,传播渠道广。对于尽调人员,企业风险信息一般包含互联网信息调查、企业自主提供材料核查等多种尽调渠道。互联网信息调查和企业纸质材料核查方式耗时耗力,尽调时间紧,很难在规定时间内调查完整,且预警效率低,无法及时获取企业舆情信息。
互联网传播速度快,传播渠道广。传统预警相对滞后,缺乏系统机制。对于尽调人员,企业风险信息一般有互联网信息调查、企业提供材料核查等渠道来尽调。互联网信息调查和企业纸质材料核查方式
耗时耗力,尽调时间紧
,很难在规定时间内调查完整,且
预警效率低
,
无法及时获取
企业舆情信息。
- 数据范围广、采集及时:达观企业舆情风控产品可将舆情资讯采集渠道进行自定义扩展,数据范围广,采集数据及时,根据业务需求可对数据上报频率进行调整,最快可达分钟级。
- 标签维度丰富,方便使用:采集上来的数据,经过NLP技术加工分析后,可对企业舆情进行多个维度打标签,如风险标签(一整套风险管理体系),情感标签,产品标签、所属行业标签等,减少业务人员阅读理解资讯时间,业务人员可根据标签快速找到想尽调的企业,以及快速发现该企业的舆情信息,提高尽调工作效率。
- 及时预警,及时应对:达观企业舆情风控平台支持对企业进行订阅,订阅后,该企业若有风险,系统会进行及时预警,可通过微信、手机、邮箱等方式通知用户,及时告警。
达观数据有丰富的toB实施经验,除舆情风控产品外,还有强大的NLP平台、智能语义搜索、知识图谱、智能推荐等产品,与舆情风控产品组合形成从数据采集、数据加工(NLP能力)、数据处理及应用的一整套金融场景解决方案,现已服务多家监管机构,以及众多头部银行、证券、保险、信托、资管、基金等金融机构,全方位赋能投行、信贷、投研、经纪、风控多类业务。