拍拍贷风险管理副总裁 顾鸣:大数据在风控中的运用

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

4月20日,UBDC全域大数据峰会Ÿ2016在北京举办。会议以“无数据不智能”为主题,除主论坛之外,分别设立了“数据化运营”、“数据营销”、“IOT和O2O数据应用”、“数据开放与发展纵横谈”四个平行分论坛。

拍拍贷风险管理副总裁 顾鸣在“IOT和O2O数据应用”论坛上,作了“大数据在风控中的运用”的主题分享。他认为:针对征信系统,其核心为大数据收集及建模等环节的落实。基于上千用户字段信息,经过层层筛选,转化,加工,最终形成对每个借款标的的准确风险概率预测是风控的重要环节。

他分享了拍拍贷基于大数据的核心风控系统“魔镜风控系统”,依托海量用户数据、基于严格的风控流程经复杂运算、建模,最终形成其风险概率预测系统。在大数据建模环节上,除申请资料、信贷数据等传统常规信息收集,还增添了多渠道多维度的海量数据来构建风险模型,包括用户的信用行为、网上行为数据、社交关系数据等,以及各类第三方渠道及维度。

以下为顾鸣在UBDC全域大数据峰会·2016中分享的速记实录:

顾鸣:

谢谢大家,谢谢主办方。我应该是这里唯一的一个纯金融的案例吧,我们做的其实也不是很高大上的金融,我是做技术的。

这里有多少人是知道拍拍贷的?(很多台下观众举手)比我想象的多。简单介绍一下我们的业务:切入的用户群是三到五线城市,25岁到35岁之间的年轻人为主体,学历都不是很高——基本上称之为“屌丝”。那么,什么样的群体我们做呢?大家如果马路上碰到一个人问我们借钱,你是不可能考虑会借给他的,这个人就是拍拍贷要做的。我们做的是小额的,因为这种人的层次还是相对比较低的,我们额度基本上控制在5千块钱以下,没有抵押的。基本上就是消费,买个iPhone什么的。这就是给屌丝的小额贷。第二是我们的获客,我们的用户进来到我们做审批,他填资料,做风控,到最终他成交,投资人投钱给他,整个一条产业线,从获客到投钱都是在线上完成,我们是没有线下门店的。

接着说一些大数据的风控运用,今天说的更多是精准营销的公司类的,这个在拍拍贷是非常重要的,但是我为什么选择风控来说呢?第一是因为我是做风控的,第二,风控作为一家互联网金融企业来说是我们的命脉,P2P现在的名声其实不是那么好,很多跑路,很小的一部分是纯欺诈的,大多数是风控做得不好,所以风控做得怎么样直接关系到这家公司存在不存在。

说一下大数据,这个定义前面嘉宾说了很多,我的注册用户量是1600万,其中的活跃用户是百万级,所以在体量上跟BAT甚至很多银行不是一个级别的,我们说的大数据更多是在维度上,我们会看很多传统金融机构不会看的东西,为什么这样做呢?接下来具体说一下。

可能要先说一下国外的线上风控是怎么做的,这是一个美国的例子,首先在最左边是包括银行、金融机构、小贷所有跟放贷相关的,它会把在它那里成交的金融数据,包括有谁他的资质,他有没有成交,他的额度是多少,他有没有定时还,这些数据都会给美国的三家征信公司,这三家公司做的就是把数据拿进来之后做清理整合。最右边的FICO,他们做的是从征信公司把数据拿过来,做一个模型,最终精确到对于每个人。从数据提供方到数据使用方,数据可以说是一个存储整理方,到最终的数据分析方或者附加值的产生方,这三个是非常独立的,整个生态是非常高效运作的,美国政府是没有参与任何一家公司的,这些除了TransUnion之外全部都是上市公司。首先这是通常情况下,第二国内大家可以想象一下,大多数的公司实际上是一二三都想做的,什么都没做的人,上来就想一二三都要做,这里有道德风险的问题,下来我们可以再交流。美国是怎么做的,美国每个人都会有一张信用卡,我第一张信用卡给了我500美金,一个人的征信历史,从买人生第一辆车,到第一套房子,银行已经通过他的征信体系知道了我这个人是比较靠谱的,所以愿意把钱借给我。

这就说到了一个风控数据的话题,这张图是我们想象得到的所有数据来源,从下越往上,风控的作用是越大的,征信是直接的,这个人之前借了5千还清了,今天再借5千,他会不会还,如果你有之前的数据,大概他还是会还,而且他在其他地方有没有借过类似的钱,负债是多少,风控是非常不错的。我之前也看到很多从国外回来的做风控模型的专家,因为你有征信了,很好做的买。接下来是消费,线上线下都有,像阿里淘宝电商数据消费,运营商就是打电话,谁打电话,话费用了多少,有没有欠费。接下来是社交,像微信微博。接下来是行为,有可能你在电脑上做了什么操作,很难完全的识别出来。从下往上,越往上这些东西对风控是越好做的,越往上也是越跟钱有关的数据,也越难获取到。在美国的征信包括了一个人所有的征信数据,但是中国没有,屌丝这种人是不会有车贷、房贷、信用卡,所以他的征信是一张,我只能想办法下沉,下面这些东西就非常多,很难用,有很多的噪音,很容易做得不好。还有一个鸡生蛋蛋生鸡的问题,如果你有消费、运营商、社交、行为这些数据,你还要征信,你需要大概能够看到不还钱的人大概长什么样,你才能知道未来怎么识别这些人,但是在这之前,你得知道这个人是不还钱的,所以你还是需要有一些征信数据,所以征信数据是非常重要的,可以说我们下面做的所有的最终目的是为了能够生成产生足够多的征信数据,对于未来的风控会越来越精准。比如说蚂蚁金服有芝麻信用分,很大的要求是基于后续还款行为数据,这个对阿里是非常重要的,它卖给你一些消费数据,实际是通过你这个小白鼠征信。

刚才说这么多,对于我们来说,类似像我们这样的数据做风控的平台来说,中国的环境是非常好的,首先很多人是没有征信数据的,所以在这个层面上起跑线是一致的。第二,中国数据相对美国来说还是比较容易拿的,什么可以用也是相对稍微松一些。对我来说,有了这么多数据,可以做跟银行差不多的事情,在我本人来说,做数据分析的人来说就有点像老鼠,可以说在全世界基于大数据做风控的只有在中国,因为中国征信非常空白。

举个例子,什么样的数据呢?我们对外说得还挺多的,这种维度说出去可能没用。比如这个人我们有一个借款,注册的时候第一要填身份证和姓名,我们要确认一下这个身份证姓名是不是匹配,然后我们会搜他填身份证这个操作用了多少时间,如果你用的时间很短和你用的时间很长,你最后的失败率会更高一些,两种情况下都可能是骗子,可能是代理中介,通过这样一个不是很直接的变量,我们可以对整个模型有一个预测性,我们所做的就是收集很多类似这样的数据。在专业上,除了大数据的一些技术手段,对于这个行业的专业有非常高的要求。当然在数据层面上,我们也花了很多的精力和资源。

大数据的处理能力、机器学习能力、专业知识需要融合和互补。这些不算是瓶颈,只要你招到正确的人是可以做的,瓶颈是在数据,所以我们非常期待能够跟像你们这样有非常多的数据的人合作。

我们是行业里相对少有的,比较有信心,业务量在上升,大多数的P2P是一个资金池的形式,投资人去那,你把钱给他们,拿个杯子去拿你的收益,但是水缸里的水有多少你是不知道的,这个水缸在漏水,如果你运气好,你的一杯水给你了,如果运气不好,到你的时候已经没水了,就跑路了。银行也是这种模式,但是银行有监管要求,水缸里有多少水是定期告诉你的。我们作为一个平台,我们的水因为是每一根水管接进来的,我们把每根水管漏多少算出来,有一根水管坏了,没关系,我们还有很多水管。放多少水是一个收益,首先我们要把风险准确预测出来,有一个标的,把还钱的可能性算出来。

这是我们在2015年4月份发布的一个魔镜系统,发布的时候还没有这个数据,这是2015年上半年的数据,6到8个月,这些标的已经基本分析到了。刚才是比较难的,这个是比较容易的,合理的定价用收益覆盖可能的风险。

所以拍拍贷想做的是那些银行现在还服务不了的,或者银行不屑于服务的,一开始通过大数据风控体系来做,之后给他们在拍拍贷内部做一个征信,最终使这些人能够得到简单高效定价合理的资金,这就是我们的理念。

谢谢。

随意打赏

提交建议
微信扫一扫,分享给好友吧。