从信息安全到数据共享,征信服务与信贷风控的融合与进化

亿欧网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
从信息安全到数据共享,征信服务与信贷风控的融合与进化

9月14日,“服务实体经济——2017中国 金融科技 未来领袖峰会”在北京双井富力万丽酒店举办。本次活动由产业创新服务平台“亿欧”主办,创新型金融科技公司“浅橙科技”联合主办。

峰会现场亿欧公司联合创始人王彬、宜信高级副总裁兼CSO陈欢、希望金融CEO陈兴垚、浅橙科技创始人CEO朱永敏、泰康在线首席市场官方远近、易鑫集团COO姜东、钱包生活CEO定胜斌、峰瑞资本创始合伙人李丰等数十位业内人士发表了主题演讲。

在圆桌论坛环节, 中诚信征信 姚明 、 考拉征信 葛伟平 、 91征信 薛本川 ,主持人零壹财经创始人柏亮,以《 大数据 时代,征信服务与信贷风控的融合与进化》为主题展开了讨论。

从信息安全到数据共享,征信服务与信贷风控的融合与进化

中诚信征信CTO姚明:从“个体信用”打通“资产信用”

柏亮:简单介绍一下自己公司。

姚明:中诚信是目前中国最大的信用管理集团,其前身是集团的征信事业部,2005年独立注册公司,过去十几年我们致力于传统企业征信及部分 个人征信 业务。

最近几年,伴随着大数据行业的发展,中诚信征信也正逐步将传统企业征信从线下融合到线上。在个人征信板块,中诚信征信是从2014年开始探索大数据征信,2015年推出了万象信用大数据征信平台,并且今年首次提出了“信用科技”的概念,立足于通过大数据、机器学习以及 人工智能 技术的进步,推动 信用评估 的智能化及信用价值的扩大化,特别是从个体信用到资产信用的贯穿打通。

柏亮:中诚信从评级开始到现在做征信,用了很多新技术。几年实践下来,在金融领域的提高客户效率等方面,有哪些实际的效果?

姚明:信用评估的角度,从几个方面去看:首先,看信用评估的有效覆盖度。央行征信的信贷人群大概在三亿,还会有几个亿的人群没有被有效覆盖。

大数据征信这个概念,其实在国外也有称之为可替代信贷信息征信的。最近几年伴随着大数据行业发展和金融科技的进步,我们探索使用一些可替代信贷信息进行征信,也就是用大数据征信。在这方面,我们最直观的感受,就是对于那些传统征信手段无法有效覆盖的人群,我们有了覆盖的能力和机会。从这一点上来说,其实更契合国家金融普惠的趋势。

举例而言,在信贷领域,可能有百分之七八十的用户因为没有央行征信记录而无法获得服务。有了大数据征信,就有可能对这部分用户里面的一部分进行信用评估,从而为他们提供金融服务,这是最直观的感受。

第二,从精准性来说,即使是那些没有央行征信记录的人群,通过消费数据、通信数据、行为数据等数据维度,利用机器学习技术建立 模型 、开展信用评估,从KS值的角度来说,30、40甚至更高都有可能达到,这取决于不同的信贷场景特点。所以,从效果上来说,使用大数据征信技术,能够达到接近于使用信贷信息的模型效果,这是从结果上来说。

第三,再从应用场景上来说,传统征信应用得更多的是围绕个体授信,包括企业与个人。中诚信征信近期提出了从“个体信用”到“资产信用”打通的概念,是在征信应用层面上的探索尝试,通过第三方征信的角度来对一份资产包中的底层借贷资产进行校验和信用评估,让资产更加透明化。

这一方式能够有效帮助哪些机构呢?假如有的信贷机构的主体信用并不是特别好,但是它形成的一些信贷资产数据是比较优良的,那么通过这种基于独立第三方征信的评估,首先会增加资产信用的透明度,其次如果评估的有效性被资金方认可之后甚至还可能帮助这家信贷机构降低资金成本,从而提供更好的金融服务给客户,这是我们在应用方面的一些探索。

柏亮:个人征信试点以来,数据的采集和使用的规范一步步建立起来,中诚信征信采集了很多非信贷数据,尤其是社交数据、行为数据等。那么,第一是技术方面,应用什么技术采集和获取数据?第二,如何用非直接相关的数据建立直接相关的模型?

姚明:中诚信征信评估个人信用主要从还款能力和还款意愿两方面,还款意愿主要依赖信贷记录信息,而对于还款能力和稳定性的评估可能会使用一些非信贷信息。无论是欧美征信体系还是央行征信体系,其实都有适量使用非信贷信息。

大数据背景下,非信贷信息的边界被扩大化了。这一过程中,各家都有不同程度的探索过程,哪些信息可以直接或很明显地应用于信用评估?跟金融相关性较强的一些数据,如消费类数据,基本上行业已经达成共识,它对信用评估是有比较显著的作用。所以,我们对这些非信贷信息的采集和使用,也有各自的评估标准。

在这几年的探索中,我们通过跟不同的合作机构去建立模型,跟踪其信贷表现数据,形成了一套自己的对非信贷信息作用的理解,这其实形成了征信公司自己的特点和商业价值。

从采集的角度来说,会遵循严格的授权原则。授权大体可以分为两类授权,一是预采集类授权,一是使用类授权。目前大部分的第三方征信公司,其实更多的是在使用时的授权,当用户去申请信贷服务时,完成授权信贷机构向征信公司发起查询,并且授权征信公司向数据源发起查询。

柏亮:司法解释出来之后,你们采集数据的范围是否受到限制?

姚明:中诚信征信开展个人征信准备工作以来,一直秉持使用合规的数据源,主要分为两类,一类是政府机构,一类是商业机构。政府机构拥有的一些数据,有权提供服务。对于商业机构,我们会看其商业服务的合理性、有效性、是否取得了用户同意等,我们有合作机构的准入标准,而且接受人民银行的监察。

我相信,司法解释只是数据行业规范的开始。在美国这个征信市场化运作非常成熟的国家,有大概20多部关于征信和个人隐私的立法,有行政监管、司法监管,也有行业自律体系,中国的个人征信机构还有很长的路要走。

柏亮:对大数据和征信里面不特别专业的人,不太容易理解非信贷数据的使用和效果。可能这些数据跟金融本身没有直接关系,我们怎么去判断? 

姚明:从行业的角度来说,征信讲究的是公平性和独立性。那么,在使用非信贷信息做信用评估时,我们也要遵循这样的原则,而且要遵守相关的法规,比如血型、疾病史等信息是不能用于征信的,这些都有明确的法规界定。

对于其他信息,我举一些简单的例子,消费类的信息,包括消费的区域、消费的类别、消费的稳定性、消费的增长趋势,能够从侧面去评估一个人的还款能力的,有直接的价值,而这一类信息并不是信贷信息。

还有其他的一些行为数据,比如在最近几年特别火爆的网络现金贷业务场景中,是可以通过一些申请行为信息,比如说在同一台手机上申请了多少笔借款,借款的时间,填写资料的时间,资料修改的次数,甚至在信贷申请界面上浏览的轨迹是如何的,这些信息其实跟信贷记录无关,跟还款能力也无关,但这一类信息在判断欺诈的时候,是有非常重大的作用的,可以通过机器学习模型,帮助我们对欺诈进行识别。

柏亮:对于普通人来说,一个女生长得很好看,工作很努力,经常加班、经常出差,涉及移动GPS地图定位等。这些数据你们都有采集的吗? 

姚明:征信公司并不采集用户位置轨迹,关于她消费和出差等,这些其实是用户画像,一个人的行为表现可能会影响我们对他信用的判断,但它并不是绝对性因素,我们可以充分利用大数据参与信用评估,您刚才说的几个东西可以作为变量特征参与信用评估,但它不是征信,征信是以客观记录为主的。

柏亮:这个模型到底怎么建立?一个女生经常加班经常出差,可能收入正在上升,这可能是正分。但是可能由于工作很累,身体吃不消,也有可能影响她的还款能力。

姚明:对信用的判断,我们不会从单一层面判断好与坏,多个数据之间的关联是要被考虑的,她经常出差,在部分人群中可能证明她有不错的能力,工作层级也比较高。但也许她仅仅是个例,也许还会有一些欺诈团伙会故意伪造这样的数据出来,这时我们要利用更多数据去检验数据真实性和有效性。

征信公司的信用评估要做到公平性和公正性,所以不会采用很少量人群拥有的特征去做。但风控可能不太一样,风控是具体到场景的,特定的信贷申请场景,有特定的人群特征,所以做风控的时候可能会用一些独特人群的特征去进行风险判断。

柏亮:现在征信行业牌照问题迟迟没有说法,征信机构是仅仅面向借贷的金融征信机构,还是可以做成一个服务于各种履约行为的社会信用机构?另外,无论是跟信息相关的法规还是跟金融相关的监管,我们还有哪些业务可做?业务范围、业务体量能否继续地快速增长?请您谈谈一到两年之内我们征信机构面临的问题和出路。 

姚明:征信的出发点在于金融风险控制的应用。征信行业发展过程中,最大的挑战来自于业务合规,就是监管部门对于征信的业务发展区间的定义和关于数据采集应用的规范。我国相关征信和个人隐私的法规,正在逐步的完善之中。所以在我看来,征信机构必须保持足够的耐心和自律性。套用刚才亿欧由总的话,我们对征信行业要保持乐观而理性的心态,乐观就是我们长期看好。理性,其实就是说要恪守自己的行业道德底线,做到充分自律,依法合规开展业务,保持足够的耐心,等待这个市场逐步成熟和完善。

从信息安全到数据共享,征信服务与信贷风控的融合与进化

考拉征信首席技术官葛伟平:未来必然会出现几家权威性巨头

柏亮:简单介绍一下自己公司。

葛伟平:考拉征信是由考拉联合六家上市公司组建的第三方独立公司,目的是让信用创造价值。在6月份,考拉征信整合了这几年的一些反欺诈和信用评估成果,推了一个新的产品叫信用直贷车,满足我们考拉信用分700分以上的客户。信用直贷车能够享受秒批直发,这也是我们现在新的尝试。

柏亮:在实践过程中,发现风险和处置风险的效率怎么样? 

葛伟平:自从开始做征信以来,遇到的最大的问题是数据共享。目前来讲,都比较碎片化,不光存在信贷机构,征信机构中也存在。这为专业的征信机构提供了产业化、多元化的机会。我们的主要工作就是在这方面做一些探索。

从考拉征信领域来看,分成两大类,一类是反欺诈;一类是信用评估,当然还有一些授信等,可以分到信用评估里面。信用评估考察你的能力,对你征信的能力。从银行工作的过程来看,银行已有的一些数据,甚至央行的征信报告数据。

我们通过提供一些更加明确的数据,比如在央行报告里面,这个月还了一万块钱,每个月还清了,两个月都还清了,对央行来说可能这是一样的。如果我们提供更明确的数据,这一万块钱它组成什么,怎么组成一万块钱,他出国旅游还是在宾馆消费等。那么,我们通过与银行的合作,把辨识的精度提高了一个层次。

另一方面,很多白户是互金遇到最多的问题。我认为可以对此做很多的发展。白户有很多的,不光是信贷数据,有很多其他APP行为等,可以辨别它的一些行为,那么也可以预测它违约的一些能力或者风险的能力。

柏亮:银行客户以及互金客户,是否接入你们的系统违约率前后会发生怎样的变化?

葛伟平:违约率比较敏感,我们说数据,帮一家银行信用卡机构做了这么一个系统。原来对数据的评判只有两个来源,一是客户填写的信用卡的申请资料,二是央行征信数据。那么加上我们的数据之后,我们做了联合建模的过程,使整个的辨别精度提高了20%。

柏亮:我们怎么划清界线,获取数据的同时与其他的金融业态保持独立性?

葛伟平:第一,不管是从哪个角度,我认为一定要有更新鲜的授权。尤其从今年6月份以来,网络安全法正式实施,守法很重要,守法很重要一条在我们征信里面,这个数据一定要有授权,一定是得到允许才能使用,我认为不光对使用方,一些数据源也是同样如此。

授权是非常大的一个概念,也很讲究,有时候存在一些问题,泛泛的授权还是精准的授权,这是第一个。第二个问题需要明确一次授权可以几次使用。 

第二,非法的买卖是红线,要做到良性的数据的渠道上来。第三,对数据的使用,我们模型来讲,是一个数据的提炼的过程,没必要放非常具体的明晰数据。比如,对一些信息,其实可以说你住在北京、上海、深圳、广州。其实你可以说一线城市、二线城市,就够了。金额也是一样的,没有必要说你这次消费了156块3毛1,我们做理想化分段,知道你在哪个区段就可以,把隐私的信息都去掉了,但是不影响到对你的信用的评估,这方面可能会隐私的保护会起到比较好的作用。

柏亮:比如我用拉卡拉支付工具的话,我在拉卡拉的所有支付数据等会直接进入到你们的征信系统?

葛伟平:第一,这阶段不会,不管是拉卡拉支付还是第三方支付公司,受到央行的监管。第二,什么时候会用到呢?不管是哪个渠道,对我要查询你这个人信用的评分,会有一个框架让你填个人信息授权资料。那时候才会采集,采集的时候不光是采集拉卡拉公司的数据。还有一些合作伙伴,比如说我们一些运营商的其他支付机构数据,APP行为数据,我也可以采集,然后形成我的一个综合的评判,给到我的一个信用报告,也许个人你是自己来征信的,也许是你通过信贷机构向我申请的。

柏亮:机构和个人之间的两难选择,就是授权这个问题。用拉卡拉或者其他的相关的工具,在用的时候可能有一个按钮就是同意,同意里面可能包含很多东西,如果我仔细读我发现可能很多不愿意授权,但是我不点同意可能什么也干不了。这之间怎么权衡,你们会把这个同意的按钮里面放有多少东西?

葛伟平:假如跟信贷机构合作,我们发现它严格按照要求来做,你借款的时候肯定会签协议,这时候它会写从哪些征信机构获取授权,有的话就会从其他征信机构,从这个角度会做要求。

第二,我们会提供一个查询界面,哪些机构到你这来查,查哪些数据。第三,我们也有界面,告诉你哪些数据在我的系统里面。第四,你可以有异议,我进行处理,如果你觉得我不想,把这个授权取消掉,我们把一些数据做清除。从开始使用到整理一直到上门处理,都会有考虑。

柏亮:请您谈谈一到两年之内我们征信机构面临的问题和出路。 

葛伟平:行业会迎来比较大的发展期,当然也需要很多的规范。

我认为,第一,数据肯定会高度地共享。美国也是如此,刚开始也是几千家公司在做,逐步整合成了三大征信机构。未来国内也会做数据的高度的共享,现在银行已经共享了,未来会到互金,从金融业到政府,汇成一个大的共享平台。

那个时候,我认为金融机构可能更多的会根据场景化包括提供咨询的服务、征信征询服务等等获得比较大的发展空间。

另外,我认为未来必然会出现几家所谓的有权威性的巨头。信贷机构,可能会要做信用评估。我可能会说首先包括我们的老百姓,可能会想到说就找这一家,这样它激发大家的热情,会愿意向这些机构提供数据,形成一个比较好的发展。那其中还有一个小的热点,未来的征信数据必然是多元化的,而不是简单的局限于我们的信贷数据。

从信息安全到数据共享,征信服务与信贷风控的融合与进化

91征信创始人薛本川:个人信贷处于下半场的开场阶段,专业分工时代来临

柏亮:简单介绍一下自己的公司。

薛本川: 91征信是一个非常年轻的企业,在细分的个人征信领域提供征信技术服务,为500多家的互联网金融公司提供技术接口。

征信行业1860年兴起,那时没有电话线,但到我们做征信的时候已经发生了天翻地覆的科技变化。这个行业其实是一个非常细分和原始的行业。我们希望能用技术的方案,改变征信领域的一些问题。

柏亮:91征信的数据来源等跟其他几家不太一样,这种方式做出来的效果怎么样?

薛本川:征信现在面临最大的问题是数据共享问题,“信息孤岛”这个词大概两三年前喊出来,我从2010年在金融企业里面入行做风控管理工作,这个问题就没有解决过。

2015年创业的时候,发现一个借款人除了在我公司借钱之外,有没有在隔壁老王借钱我不知道,没有人管。因此我想办法如何从一些技术的角度出发,让每一个互联网金融公司或民间放贷公司,能够非常清楚在隔壁老王家借了多少钱。

借款人在民间机构没有监管,特别碎片、零散。这种共享问题确实是征信行业最大的问题。91征信采用的方式非常简单,能够让每一个互金企业、房产机构,把它们的数据库用接口互相连接起来,形成征信网络,分布式数据库。这样就避免了一个传统的征信过程中需要每一家公司定期上交数据。那种方式我认为稍微原始,想有创新的话,可以把数据库连接,可以互相查询。

最开始是用征信解决反欺诈问题,判断用户是坏人还是好人,判断好人比较难,因为把钱贷给他才知道他是不是好人。从2013年开始,有机构开始做反欺诈,到最近几年有的做得非常大。现在为止,可以清楚地告诉大家,我们的风控的工作越来越专业化,已经开始变成了从反欺诈、防坏人的方向,转向防好人了。

理解一下,已经放贷的客户他今天是好人,但有可能明天就会在隔壁老王家借一笔钱,后天去老李家借一笔钱,他的成本越来越高,这就导致过度授信。

柏亮:共享性的征信机构,大家在获取数据的完整度、维度和真实度上,可能面临比较大的问题,作为中间的数据枢纽和数据处理的机构,91征信有什么更好的解决办法?比如说有的机构也共享数据,但会“掺沙子”。

薛本川:数据真实性问题,是我创业以来被大家问得最多的,不只是我们公司,就连央行征信中心也同样面临这个问题。一般是两个方向去解决:

第一,做主动的监督核查,要求提供一些资料来判断信息是不是真的。另外是被动的发现,就像有规定的信息主体对这条信息本身产生了异议,因为借贷这个信息,就只有两个人是一定知道的,一个就是我给出去钱的这个人是一定知道的,另外一个是拿到钱的人知道的。为什么从放贷的人那里征集?因为他可能会放很多的钱,我从放贷人那边拿到这个信息,核验这个信息就是从隔壁的放贷人核验,他也遇到了同样的借款人,这样去征集。

第二是手段,很多时候在搜集信息有点一味追求数据的庞大、数据维度的深度,我们最早有看过很多失败的案例。他们要求客户放贷主体提供一个人的所有信息,维度越多,你在判断信息真假的难度上就会越大。所以我们要求用户提供的维度非常精简,这是在真实性的执行层面的做法。

另外还有原则上的问题,就是说一个人做假的动机, “掺沙子”的原因。前几年有闯红绿灯,以前闯就闯了,撞了人没有特别大的惩罚。到后来,在红绿灯上面加摄像头,你不看他他都不会闯,增加了发现的机制。

提供数据这一块除直接进行数据交换之外还要提高违约成本,如果在我们这个平台上面有任何一家公司,被发现数据有“沙子”,则永久不合作。维护数据真实,保证数据“掺沙子”不会在分布式数据库中产生。

我认为,征信数据共享的趋势,从1860年,大家为了能够实现客户的交叉销售,零售商把数据交到一个地方去进行共享、交叉销售,到后来出现了电话线,出现了网线、数据库,大家把数据交到一个地方,到现在阶段就是每一家公司各自有各自的数据库,它没有必要或者没有道理把这些数据全部定期交给我,各自处理各自的数据,做好数据连接,这是做好数据共享的第二步。

征信行业最有可能发生 区块链 落地,交易多方互不信任,有一个分布式的各自管理各自的数据进行连接,将来肯定会出现一个趋势,每一个放贷主体甚至借款人本人,信息是所有人拥有的,每一个机构拥有的数据是一样的,这时候验证数据的真实性、交易记录的真实性就会变得更加便捷,这些都是随着科技的应用以及每一个授信主体或者参与我们的会员单位,他们征信能力提升是会利好的。

柏亮:现阶段共享数据,个人信用贷、现金贷领域占量比较大,这两年粗放型生长更关注规模,会使这个行业的征信受到影响。从你们现在共享几百家的数据的情况来看,你觉得现在的现金贷在整个从兴起到繁荣到衰落的周期中处于什么阶段?

薛本川:数据证明,现在处于下半场的开场阶段。央行征信中心2014年发布的报告数据显示,收录了8.5亿人数据,其中有3.5亿人是在央行有记录的,有5亿人左右没有记录。这些人其中真的有能够让你放的出去贷款的用户。

央行每天大概产生100多万次的查询记录,我们每天大概是50万次左右,占三分之一左右的份额。整个细分一下,现金贷比较大的公司大概有几百万的受众群体,相比于5亿人来讲,是几百万的客户并没有完全占领这个市场。这个市场还是非常大的,获客成本不断提高。

上半场第一步是摸索模式,从没有人敢干,到有人敢干,踩完了所有的坑。第二步,每一个细分的公司把握自己的工作,比如我们专门做征信,有人专门做获客,有人专门做风控模型,每一个坑上都有不同的公司。

上半场大家摆好了站位,站好了自己的位置,准备好了战术,打法准备好了,下半场开场的时候,会有很多新进的大佬做这些事情。整个消费金融行业里面,包括现金贷行业里面,最开始火爆的是消费金融。只不过大家没有注意到,行业大佬起家的时候,我记得新东方等很多学生做教育分期,后来火了很长时间的小额信贷,火了很长时间的房贷、车贷,去年供应链金融等全都火了一遍。

下半场开始的时候,前面所有的场景、所有的人群都有人踩过了,所有你需要的工具、需要掌握的功能,你有专业技术提供了,这时候就会有具有个人特点的公司,开始进入到这个领域。

我们说点恐怖的数据,上半场的这一段时间里面,发现过单一借款人在132家公司借过钱,共贷这件事是有发生的,抢规模抢着抢着就发现有坏人,坏人有多少?没多少,法院执行类的信息,据说大概有三四千万人。还有一些坏人在央行里面逾期的,总共3.5亿人,坏人按照信用卡的逾期率万3很高了。

柏亮:请您谈谈一到两年之内我们征信机构面临的问题和出路。 

薛本川:第一,我认为技术上会有很大突破,技术和监管永远在互相博弈。个人征信管理条例是2013年出的,这是我们所面临的机遇和挑战,就是在技术上如何突破,如何加强和监管层面的沟通。

第二,业务方面来说,从国外经验来看,金融行业是应用场景最深的,然后同时也开始发展到一些商业履约上面,未来一到两年我认为还是在金融机构的数据共享上面最基础的工作上面,征信行业是有很大的机会,也会有很大的发展。


2017年9月14日,亿欧智库正式发布了《2017中国智能金融产业研究报告》,该报告在梳理智能金融概念、宏观环境和公司现状的基础上,总结了七大应用场景,并分析了金融机构的智能金融应用以及互联网巨头的布局,最后总结了智能金融的未来发展趋势与挑战。了解更多报告内容,请点击: 《2017中国智能金融产业研究报告》 。

从信息安全到数据共享,征信服务与信贷风控的融合与进化

本文系投稿稿件,作者:姚明/葛伟平/薛本川/柏亮;转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。

随意打赏

大数据风控征信数据信息共享信贷信息征信风控
提交建议
微信扫一扫,分享给好友吧。