京东金融与ZestFinance合资组建ZRobot,能解决有效数据少的用户的信用评价难题吗?
运用大数据在获客和风控环节提供技术支持,是目前很多互金公司正在做的事。这里面的难点主要包括部分用户的有效数据少、模型适用性差等。比如一些触网比较少的农民群体,数字化的数据信息很少,如何通过大数据技术来判断信用状况并为其提供信贷服务?能否通过提升模型的质量,来弥补有效数据不足的问题? 京东金融 通过合资公司 ZRobot ,正在进行这方面的尝试,其有效性可以进一步观察。
京东金融 与 ZestFinance 的合资公司 ZRobot 开业
今天( 11月3日 ), 京东金融 与美国大数据公司 ZestFinance 联合发起的合资公司 ZRobot 正式宣布开业。ZRobot定位于大数据技术公司,提供包括数据建模、信用评分、资产定价、欺诈识别、精准营销等能力在内的数据增值与技术应用服务,帮助企业提升商业决策效率。
京东金融联合ZestFinance成立数据技术服务公司ZRobot
ZRobot发布了旗下两款产品——“漫网”和“盘古信用模型”。“漫网”将利用复杂网络技术进行反欺诈风险管控,“盘古信用模型”则能针对信贷用户给出信用评估建议,有效降低不良资产率。
目前,ZRobot主要服务银行、汽车金融、消费金融、小贷公司等金融及非金机构的信贷领域,提供信用评分、风险定价、欺诈识别、精准营销等数据技术服务,未来ZRobot还将覆盖更多类型的金融机构与非金融机构。
ZRobot的外方股东ZestFinance大家应该也不陌生。ZestFinance是美国知名的大数据科技金融公司,通过机器学习和大数据技术进行个人信用评分,服务于那些在传统个人征信体系下无法正常使用金融服务的用户。2015年6月,ZestFinance获得京东D轮1.5亿美元投资;2016年7月,ZestFinance获得百度投资E轮,并与百度展开合作。
ZRobot称可以对有效数据较少的用户进行信用评价
ZRobot CEO乔杨表示, ZRobot核心竞争力在于数据挖掘能力和模型开发能力,善于从海量金融弱相关数据中发现与信贷表现相关的变量,利用机器学习技术,评估用户的信用风险,深度剖析客户画像。
ZRobot CEO 乔杨
乔杨表示,具体来看,ZRobot的先进技术体现在三个方面:
第一,能够处理高维度数据,维度高达2万余个;
第二,可处理数据的类型丰富,结构化与非结构化的数据均能处理,涵盖文本、声音、图像等多个类型;
第三,模型对数据质量依赖程度低。基于深度学习的建模理念,ZRobot的模型针对有效数据记录较少的“弱活跃用户”,也有很强的判断与预测能力。其利用授权用户的订单、浏览、通讯等互联网行为数据,充分挖掘数据价值,预测分析上万个维度的变量,建立的信用模型具有普适性及稳定性,充分覆盖缺乏信用记录的年轻人群,有效弥补传统模型的不足。
如果ZRobot的技术真的如宣传中有效,可能会对京东的消费金融、供应链金融、农村金融等业务提供有力的技术支持。对于一些有效数据偏少的用户,可以通过模型来判断信用状况。
此前,京东农村金融负责人洪洁曾坦言在农村遇到两大问题:一是农民的意识问题,对互联网金融产品存在认识不足;二就是数据缺失,数据标准化程度欠缺。发展农业信贷相关业务,农村的数据不完整、不连续,是无法回避的问题。如果ZRobot的技术能够有效应用,可能会在一定程度上帮助京东金融业务在“弱活跃用户”群体中成长。
对数据量少的“弱活跃用户”进行信用评价,怎么实现?
对于一个数据量偏少的用户,通过建模技术来评判这个人的信用状况,这有实现的可能吗,怎么实现的?
从常规的角度看,通常经济计量模型对于数据的要求非常高,数据的数量和质量越高,模型的有效性就越好,对经济现象的解释和预测能力就越强。但在发展普惠金融的过程中,面临的很大的难题就是普惠金融要为那些没有在传统金融体系中获得服务的人群提供服务,而这类群体数据量偏少,难以通过传统的数据模型来判断信用状况。
大数据时代的来临和深度学习技术的进步为改变这种状况带来了契机。互联网、智能手机、社交网络等大行其道,使人们的很多线下行为线上化、数字化,有效增加了评判信用状况的维度。深度学习技术则提升了模型的有效性,可以在综合更多维度的基础上有效建模。
收入、消费、信贷记录等数据对于评判用户信用状况的作用可能是立竿见影的。对于缺少这方面数据的用户,如果能通过全方位搜集各种数据,如用什么手机,下载了多少APP,喜欢什么游戏,发朋友圈的频次与内容,有怎样的地理位置运行轨迹等,都可以组成很多不同的特征向量,从不同维度对用户的信用状况进行或深或浅的揭示。
这些特征向量与用户信用程度的相关性或强或若,可以通过模型进行测算,为不同的特征赋予不同的权重,综合判断用户的信用状况。在这一过程中,大数据带来了各种维度的数据信息,深度学习等技术则提升了预测模型的精度和有效性。
模型一定有效吗?
当然,大数据与深度学习等技术的进步,只是带来了解决数据量少的“弱活跃用户”信用评价问题的可行性,并不意味着一定能解决,或者完美解决。
首先,技术能解决的是有效数据少的用户的信用评价难题,注意这里是有效数据少,而不是数据少。也就是说,虽然有效数据少,但有不同维度的弱相关数据,也可以在一定程度上判断用户的信用状况。如果数据量本身就很少,连维度都很少,那么再高深的模型也爱莫能助。例如对于一个手机、网络都不使用的用户,其行为都没有数据化、线上化,那么模型也就没有用武之地了。
其次,模型的有效性需要经过时间和市场检验,至少要经过几个放贷周期的测试,才能说明模型是否有用,是否够精准。模型的不断迭代也是必经的过程,放贷过程会不断有数据产生出来,运用这些数据对模型进行进一步升级,使模型更加有效,是提升模型有效性的关键。