恒昌CTO薛正华:新科技驱动的新普惠金融
6月15日,亿欧金融在上海正式举办“ 2018智能+新商业峰会——智能+新金融峰会 ”,探析AI、区块链分布式技术和大数据带来的金融业智能化,展望新一代智能金融的基础设施和未来应用蓝图,推进智能金融的演进。
此次峰会由上海市经济和信息化委员会、上海市商务委员会、上海市长宁区人民政府、上海市互联网金融行业协会指导,上海市长宁区青年联合会和亿欧公司联合主办。
英凡研究院、星合资本、百融金服、融360、同盾科技、包银消费金融、新网银行、网商银行、快牛金科、拍拍贷、恒昌公司、光速中国、宜信新金融产业基金等单位出席本次峰会。
恒昌CTO薛正华现场发表了题为《新科技驱动的新普惠金融》演讲,薛正华演讲要点如下:
1、网贷是一个非常有挑战的行业,想做好特别不容易。
2、网贷行业竞争非常激烈,同时随着监管收紧,很多政策上的红利也慢慢消失了。
3、金融领域核心的东西是风控。风控的基础是什么?大数据。
4、信贷知识图谱将成为金融产业的基础设施,在诸多领域的应用变得越来越重要。
5、人工智能作为金融产业的基础,未来将应用在整个信贷全生命周期,从获客到风控到贷后的资产管理都将发挥巨大作用。
以下是薛正华演讲正文:
各位亲爱的嘉宾们,大家下午好!非常感谢大家这么晚了还能够坚持在这里听我们的各种想法和报告。我想给大家呈现一些在金融科技领域的一些实战的干货,和大家分享一下。
首先我想和大家分享一个数据,大家看到这个是最近几年网贷行业变化的情况,在大家左手边是整个网贷行业成交量的走势,2016年底,2017年左右的时候达到了高点,从2017年开始往下走。
右手边的图,大家可以看到的是,整个正常运行网贷平台的数量,2015年底开始有一个跳水,为什么会出现这种情况?我觉得这个跟很多行业非常类似,就是刚开始的时候都是上千家平台,我不知道大家记不记得“千团大战”,大家想想今天还剩下几个团购公司。
网贷也是一样的,最多的时候应该有三五千家,但是在这两年大量的没有竞争力的一些网贷公司纷纷倒下了,为什么倒下?我觉得有几方面的原因。
第一,从事这个领域的网贷平台没有意识到网贷是一个非常有挑战的行业,想做好特别不容易。
第二,竞争非常激烈,同时随着监管的收紧,很多政策上的红利也慢慢消失了,所以说这是为什么会出现这么一个图形的原因。
这两年大家在说大数据,大家知道在金融领域核心的东西是风控。如果风控厉害,可以把业务规模往大撑,这样可以进入收益的正循环。如果你的风控不行,业务规模越大,死的越快。所以说,风控是金融最核心的东西,不管是网贷还是传统的金融业务,是一样的。
那么, 风控的基础是什么?大数据。 不管是网贷平台还是银行,如果没有足够强的大数据作为基础,你说能把风控做好,没有人相信。所以,大数据是风控的基础,这个逻辑非常清楚,想把金融行业做好就得把风控做好,想把风控做好就有得非常强大的数据基础。
在过去几年,我们在大数据方面有几方面的来源。一个是我们自己业务的数据,另外一个是公开的一些数据,比如说网上公开的这些名单,包括在58,百度、贴吧、赶集公开的地方收集的,这些名单我们会筛选处理,选出白名单、灰名单和黑名单,我们现在也有4000万左右的数据。另外一部分是用户合法授权的一些数据,这个我们会把它作为信贷的重要考量的标准。
有了这些数据之后,如何用这个数据?这是一个非常关键的问题,怎么支持恒昌的核心业务,怎么把信贷做好。恒昌2016、2017年投入了非常大的团队在做的工作,就是大规模的信贷知识图谱,我们构建了支持上亿,上百亿关系的超大信贷知识图谱。
信贷知识图谱怎么用?我给大家举几个实例,大家右手边是真实的案例,我们把东北部一个省,2015年、2016年两年的数据做了一个数据分析,王某在做借款的时候会提交很多信息,比如你的姓名、身份证、联系方式、联系人、电话号码,包括你的工作单位等等非常多的信息,知识图谱系统把这些数据作为一个节点存在。
另外一个借款人姓高,也有很多属性,我们的知识图谱系统会把他的属性和已经有的属性进行自动关联和匹配,我们发现三个人是同一家公司的,那么我们系统会给他自动构建一个同事关系链,我们经过大数据统计分析,我们发现当一个人周围不管什么关系连接起来的,如果有两个出现过逾期,这个人出现逾期的概率是89%。如果有三个人都是有问题的,那么他出现的概率是91%、96%。我们用大数据的方法,用图的关系生成一些新的欺诈和信用有关的。这是用知识图谱做的事情。
我再举一个例子,这是一个实例,目前我们公司做了有超过100万的贷款用户,用户里面,每个用户假设有一百个属性,各种属性,大家想想这个数据项有多少,有一个多亿的数据项。想在一个多亿数据项里面找到不同数据项之间的关联是比较麻烦的,在知识图谱里面我们通过机器自动找出关系。
举一个例子,比如大家的右手边看到这个实例。这五个人在不同的时间、不同的地点来提交的,我们发现这五个人竟然用同一个邮箱,这是不可能的。邮箱我们每个人只有一个,为什么出现这样的情况,这是非常典型中介代办的欺诈案例。中介为了省事,因为他要包装很多人骗贷,就会申请邮箱,如果我们通过了会发一些邮件信息,他为了处理起来方便就用一个。这个时候,我们通过这些技术,通过知识图谱关系,自动把欺诈的过程炸出来,不用人去做。
信贷知识图谱还能干什么?第三个业务场景,就是行业的难题——失联修复,就是说在小额贷行业里面,很多人借钱以后电话号码一扔,就找不到他了,其实也能找到,因为他是小额的,找这个人花的成本太高了,很多大公司就不找了,但是这样的话就造成逾期,而且很多人知道这个东西以后就恶性逾期,这是一个非常不好的问题。怎么解决这个问题呢?我们在过去也是利用图谱,在我们的系统中一个人周围有一两百个人一度联系人,我们通过算法和分析,在一百多个一度联系人当中筛选出哪些人跟他有强相关性,我们会给每一个编一个权重来计算判断,比如通过频次比较高,比如说称呼里面爸爸妈妈之类的,我们会把权重加高,或者单位的领导等等,我们通过一度联系人找到他。
大家可以看到,其实我们在上线这个技术的当月,我们的失联修复已经到了行业的非常高的水平,目前我们已经到了40%的水平,我相信随着我们图谱数据量增多,我们最终达到80%,90%的水平,彻底把这个难题解决掉。
刚才和大家分享了一些大数据方面的工作。人工智能领域我们在2016年12月份的时候,上线了人脸识别,后期我们跟行业里面做的非常好的顶级的人脸识别公司合作,进行借款人身份证的识别。
2017年10月份,恒昌的声纹识别系统上线,声纹和眼睛的虹膜都是人体唯一的标识,为什么做这个事情,我们发现大部分欺诈是中介包装,普通人是比较难的,但是中介因为整天研究各家平台风控的漏洞等等,它是比较专业的。怎么能够防住这些人欺诈呢?我们后来讨论很多,我们发现,有一个东西很难改变就是他的声音,我们通过声纹的识别,他上次帮借款人骗我们,比如他是借款人的某某领导,下次变成另外一个公司的领导,我们就根据他的声音判断出来他已经出现过了,到目前为止我们已经累计了30万的声纹,目前我们的技术可以做到9秒钟识别出30万样本中这个声音是否出现过,利用语音识别技术把声音翻译成文本,比对一下文本和上次文本的差异到底多大,来识别出是不是有欺诈。
我们目前正在全国试点的技术,就是我们的远程面审技术,过去人要到门店去看,效率比较低。2017年10月份,恒昌研发了远程面审,客户可以在任何时间、任何地点进行面审,提高效率,降低欺诈的可能,特别降低内外勾结的欺诈,因为你不知道被谁审。
今天更多是在把人工智能的一些技术,除了刚才大家看到的反欺诈技术之外,我们应用在我们整个信贷全生命周期,从获客到风控到贷后的资产管理。这是我们目前流量方面做的工作,我们在过去一年多,我们合作了三四百家渠道,包括融360,包括百融等等都有四五十家大的,还有三百多家小的贷款超市,和他们合作。合作之后怎么持久稳定地发展呢?我们对整个渠道上百家的渠道进行量化评分,我们根据客户的转化情况,以及逾期情况进行量化评分,以此筛选出来哪些渠道是好的客户,哪些渠道是差的渠道,不断循环迭代,这里面也是对渠道进行量化评分,做调控,以及精准管控。
第二块也是我们最核心的东西,我们会继续地把我们的风控利用图谱以及深度学习的技术进行反欺诈的识别。最后会把整个人工智能技术应用在贷后的资产管理等多方面。
另一方面我们做了一次改进,我们让每一次打分之后必须有一个反馈,我的评分不一定是准的,我们评1-10分,1是容易的,10是比较难的。你实际作业过程当中,发现这个1挺难回款的,应该是5才对,这个分数反馈给机器,我们差不多有六七百个做贷后作业的人,这六七百个人平均每天打电话的次数在200-300通,假设算200,每天可以反馈12万的数据告诉机器你评错了,或者你评的很准,这样的话,人和机器不断的交互,机器通过大数据分析的结果告诉人,让人更加高效回款,人实际的作业情况反馈给机器,模型就会不断迭代,越来越突出。我们相信利用这些技术可以把贷后深度学习的技术做的更好。
最后,大家可以看到左手边的技术都是我们已经上线的技术,右手边的这些技术也是正在不断完善的技术。我们相信通过我们的大数据技术,通过我们的生物识别技术,通过我们的深度学习做的模型技术,在获客的模型,在风控反欺诈,在贷后的模型,我相信人工智能的技术、大数据的技术,一定会让普惠金融做的越来越好。
谢谢大家!
本文系投稿稿件,作者:薛正华;转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。