走近Fintech :大数据对传统金融业进行了怎样的改造?
大数据 ,与 人工智能 、 云计算 并列为第四次工业革命中最引人注目的技术。早在1980年,著名未来学家阿尔文·托夫勒就曾在《第三次浪潮》一书中称大数据为“第三次浪潮”。然而直到移动互联网是时代来临,“大数据”才真正应用到很多产业中,如今已经成为颠覆传统产业的巨大力量。在金融产业的变革中,大数据作为重要的科技手段,在风险控制、市场营销等环节起着重要的作用。
现在,金融机构之间的竞争将在网络信息平台上全面展开,金融业迎来“数据为王”的新时代。大数据对传统金融业进行了怎样的改造?被金融公司大力推崇的大数据风控是如何实现的?我们走访了一些Fintech公司,试图找到答案。
“对于传统金融机构无法覆盖的人群,谁来解决他们的金融服务需求?”
智融时代创始人:焦可、齐鹏、赵波
出生于1980年代的焦可参与并见证了中国互联网发展的黄金时代。研究生毕业后,他来到飞速发展中的百度,此时的百度刚刚六岁,还是一家仅有400位员工的互联网新贵。2005年到2011年,焦可目睹了一家互联网巨头从初出茅庐到名扬天下的全过程。“百度用十年的时间做成了一家传统行业30年、40年才能做成的事,这就是创业公司的魅力所在。”焦可说道。经历了百度、赶集网、马可波罗三家不同阶段公司的从业经历后,2013年,焦可创办了智融时代信息技术有限公司,开始了自己的创业之路。
百度系创业者,最擅长做的就是搜索引擎。焦可认为,搜索引擎的使命是致力于消除信息不对称,百度在通用领域搜索引擎老大的位置已经难以撼动,而各种垂直领域的搜索引擎还有很大市场空间。经过一番考察后,焦可和他的团队选择了金融行业,于是一款名为“贷小秘”的金融产品的搜索引擎应运而生。谈到最初对这个产品的设计,焦可说:“我们一开始的判断是,有很多想找贷款的人,他们可能不知道哪家银行有什么产品,银行也想找符合自己产品要求的人,我认为这个领域就有信息不对称,‘贷小秘’就致力于消除这种不对称。”
在操作过程中,他却发现自己的市场定位有着严重的问题。因为国内的金融机构能够覆盖到的人群仅占总人口的15%左右,而在国外,这个数字是70%。这就意味着,即使人们从“贷小秘”中找到了需要的金融产品,其中85%的用户也无法进行贷款。这一情况使得“金融产品搜索引擎”的定位成了无米之炊。
“贷小秘”的滑铁卢凸显出一个潜藏的市场需求:对于传统金融机构无法覆盖的人群,谁来解决他们的金融服务需求?
传统金融机构做信贷业务,最重要的环节就是风控。传统风控方式主要由人工完成,通过用户自己提供信息,然后银行或审批机构人工核实这些信息的真实性,最终用机构内部建好的风险模型进行数据分析,从而得出对该申请人的信用评级,再进而决定是否授信以及授信金额的大小。
这一套逻辑的根基在于用户所提供的信息,一般包括银行征信、固定资产、社保信息、工作单位、收入情况等。掌握了这些信息后,银行才可以进行后续的核对及评分。然而对于初入职场的毕业生,或者没有稳定工作单位的蓝领人群,银行无法采到上述数据。
因此,如果想要做这个群体的生意,焦可及他的团队所面对的问题是:如何使用一些区别于传统金融机构采集的数据,打造出一个新的风控体系。
大数据与移动通信 时代的到来为这件事提供了萌芽的土壤,“这个业务早两年是做不了的。第一,早两年很多数据是没有标准化或者没有开放的;其次,移动通信时代的到来后,手机成为一个重要的信息采集端口,它几乎是与个人关系最紧密的设备,所产生的数据非常更多元。”焦可说道。
“定量性的评估,概率性的结果,这种场景非常适合机器运作”
2015年以来,政府部门曾多次发文鼓励相关政府部门、企业实行数据公开,从而进一步推动大数据的应用,发挥大数据对社会的积极作用。这一政策导向在一定程度上促进了大数据的商业化,如今,有越来越多的第三方机构把手中的大数据进行商业运作,在“脱敏”(指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护)后放到市场上。
目前国内对用户数据采集的渠道主要有央行征信中心、银联的银行卡消费数据、学历认证。2015年,央行首次批准了八家可开展个人征信业务的机构,分别是:芝麻信用、腾讯征信、前海征信、鹏元征信、中诚信征信、中智诚征信以及拉卡拉信用、北京华道征信。当然,用户在京东、淘宝等消费平台的消费信息,在航空公司、出行软件中产生的出行数据,在通信公司、社交媒体产生的通信数据,被视为重要的数据来源。
然而仅仅获取到大数据是没有意义的,因为不论大机构还是创业公司,能够得到的数据基本是相同的,并不存在“独家数据”。大数据技术的战略意义并不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
对于金融机构而言,除了以上公开的数据来源外,还有各平台的自有数据:包括用户在App上产生的行为数据,如填写时使用的机型,登录时间和地点,填写资料所用的时间等;以及用户在该平台的历史交易数据。
以上所有数据处理后,每个用户会产生成百上千个特征。然而并不是所有的特征都有用,考虑到收集、存储数据的成本,技术人员必须不断优化,去掉无用的特征,把有用的特征调整到合适的位置。
焦可介绍说,用钱宝系统共连接了三四十个第三方数据源,共产生几千个不同特征的数据,经过一番筛选,最终每个用户大概会产生200余个有用的特征。技术人员再利用这200个特征建模分析和机器学习,最终构成自己的一套风险评级体系。
根据原始数据,技术人员可以把它处理成各种有用的信息。焦可告诉记者:“比如原始数据是用户身份证号,加工成年龄、户籍甚至星座。我们如果想知道年龄与逾期是否相关,往系统里一扔,15分钟就可以得到一个非常定量级的相关度。”定量性的评估,概率性的结果,这种场景非常适合机器运作。
人工PK人工智能
与传统的人工进行风控相比,机器学习有着明显的优势。最显而易见的就是机器的“高效”和“勤奋”。只要用户给予系统征信授权,机器可以在一分钟之内完成征信过程。焦可介绍说,2016年9月底,用钱宝每天处理的订单量已经突破8万,成功放出去的贷款也可达到日均一万多笔,这样的效率在传统金融机构是无法想象的。此外,“机器人信贷员”可以做到365天全年无休地工作,这也是人工无法替代的。
更深层的优势是机器的“不断迭代”,在传统金融机构,最快也要半年调整一次风控模型。而“机器人信贷员”则每一天都在变聪明,每一笔新接触到的样本都会让它比此前更精确。假设机器每天放贷一万笔,周期为30天,这就意味着在30天之后,机器可以得到一万笔样本数据返还回来。技术人员可以根据返还的结果得知,目前的模型所圈定的特征是否有效,从而进行相应的调整。
大数据风控可以解决传统风控信息不对称,数据获取维度窄,人工采集成本高、效率低等缺点,然而这种科技驱动的风控方式也非无所不能。在大额信贷业务中,如果用户的很多数据没有做到完全标准化,就不适合用大数据进行风控。焦可举例说:“比如房子的定价,涉及到人的经验,所以你无论如何都要去看一眼。我们不妨这样理解:在一个具体的垂直领域里面,只要这个领域的数据化程度足够高,机器就会比人好很多;而面对一些开放性的问题,人的经验就是无可取代 的。”
与传统的金融机构不同的是,一家Fintech公司中,计算机背景的人才比金融背景的人才需求量更大。智融时代科技公司团队规模将近70人,技术人员占到近70%,其中包括十几位百度T6级别以上的资深技术工程师。根据公开数字,用钱宝实际注册用户数达到400万,实际业务量9月份已突破40万笔,发放贷款达6亿元。近日,用钱宝宣布获得1.56亿元B+轮融资,由光信资本、源码资本、洪泰资本、创新工场、晨兴资本及51信用卡等多家投资机构共同投资。
大数据风控下的消费金融
读秒CEO周静
近年来,中国消费金融行业飞速发展,消费贷款规模逐年扩大。据艾瑞咨询数据显示,截至2014年末,我国人民币消费信贷余额15万亿元;到了2015年末,我国消费信贷余额达19万亿元;预计2019年将达到41.1万亿。市场潜力巨大。
随着消费金融时代的来临,互联网也成了人们接受金融服务的重要平台。实力雄厚的巨头重金打造自己的金融服务体系,并在其生态体系占据越来越重要的地位,成为电商数据变现、打造生态的重要路径之一。
并不是所有电商或者场景都有实力打造出自己的金融体系,但他们也需要嵌入消费分期业务。一些技术实力强劲的团队看到了这个市场需求,打造出致力为B端提供全套智能信贷服务及技术解决方案的产品,诞生于今年6月的POWERED BY DUMIAO就是其中之一。
POWERED BY DUMIAO是智能信贷服务方案提供商读秒的核心产品,背后倚靠PINTEC智能金融服务集团强大的实力支持。读秒的“掌舵者”周静拥有近20年金融业风险管理经验,曾在全美前十大银行之一的CapitalOne任职8年,曾任产品、市场、风控等岗位。后来进入渣打银行,带领渣打创立了零售风险管理团队,任渣打中国零售银行首席风险官,是渣打中国无担保个人贷款“现贷派”风控创建人。
POWERED BY DUMIAO将智能信贷模块化,拆分为贷前、贷中、贷后三个环节,并细分到用户筛选、资金提供、大数据风控、授信决策、账户管理、催收、贷后交叉营销等数十个模块。
贷款前,在众多的消费者中,读秒会以用户画像为基础进行“精准获客”,用大数据锁定最有价值的用户,保证客户转化率和产生的价值。互联网场景内积累了众多精准用户,若将这些客户零成本延伸成为金融客户,既增强了用户对平台的黏性,又为平台衍生出新的商机。
贷款中,消费者若需要进行分期,只需填写信用卡、手机、身份证等基本信息。读秒接收到用户填写的信息,再结合其内部数据和多方数据源,可以在非常短的时间内完成大数据风控、风险定价、线上授信。根据不同用户的信用、风险水平,读秒还会实行“精准定价”,提供用户能承受的最合适利率,确保用户可以按时还款,保证平台的获利。
贷款后,读秒还可以提供一系列贷后管理服务,包括还款提醒、自动扣款、复贷优惠、智能催收等环节。如果客户出现逾期,读秒会根据预测的成本,测算出应该使用的贷后管理方式及频率,进而优化资源的配 置。
系统的高度适配性是POWERED BY DUMIAO的一大技术优势,整个体系可以根据不同情况,迅速嵌入到不同的消费场景中。电商的需求各有不同:有的需要读秒包揽全流程;有的倾向于自己打造产品框架,嵌入读秒的标准化的风控模块;有的希望读秒与自身场景结合,定制化打造场景化风控和贷后模块。企业如果要引入读秒的智能信贷技术解决方案,嵌入的方式与程度因对方需求而定,通常在4周内就可以完成全部系统的部署。这样的合作模式给模型适配的能力带来很大的挑战,需要对各流程进行十分复杂的适配性改造。
POWERED BY DUMIAO主要面对两大客户群。针对零售企业,读秒可以输出全流程的零售信贷服务解决方案,帮助企业扩大客户群体,促进销量,增加用户的黏性;针对金融机构,读秒帮助其切入长尾、碎片化的消费信贷场景,可以追踪资金的流向,并确保流程透明,以及较高的安全性。目前,该技术已经进入旅行、电商、医药、小微企业贷款等领域,未来还将开发汽车销售、大卖场、中小企业服务平台的信贷解决方案。
对于这款产品,周静非常有信心。做这样的技术输出,对团队的技术与资金支持都有很高的要求,这也是POWERED BY DUMIAO在市场上难逢对手的主要原 因。
这一系统对于技术提供方服务器提出了很高的要求。每逢双十一或节假日,商家做营销活动时,会有海量的并发同时达到POWERED BY DUMIAO,对系统会造成很大压力,在这样的场景下要保证用户体验,并不是一件容易的事。
大数据时代,谁来保护用户的隐私
读秒CEO周静
大数据技术的使用无疑为金融产业带来了很多好的改变,但伴随而来的隐私问题也令业界非常苦恼。
微软研究院的高级研究员博伊德(Danah Boyd)曾经表示:“如今,我们社交网络化的社会绝对有制造恐慌的天分。在大数据时代,对隐私泄露的担忧就是强大的紧张和焦虑的源泉。人们普遍认为,最令人焦虑的在于你根本不知道什么时候自己的隐私就无意中被泄露出去。”
周静坦言,现在这个时代数据的确已经多到你“无法想象”的地步。同时她也强调,随着数据保护措施的不断完善,正规的公司往往会对使用的数据做很多隔离。
“即使在客户已经知晓、授权的情况下,我们也尽量避免要求客户给一些特别敏感的数据,我们认为真正好的客户不会为了一笔小额贷款告诉你最私密的事情。”周静说 道。
注:本文摘时间线杂志,作者伊珊,版权著作权系原创者所有,转载请注明出处。数据观微信公众号(ID:cbdioreview) ,欲了解更多大数据行业相关资讯,可搜索数据观(中国大数据产业观察网www.cbdio.com)进入查看。
责任编辑:汤德正