连谷歌也会犯错?看美国金融大数据建模的成功与失败
作者:百分点
裁员、罚款、倒闭……2008年全球金融危机导致银行业哀鸿遍野,而Capital One(美国第一资本金融公司)却一枝独秀,不断兼并,茁壮发展壮大。回看美国消费金融的发展史时,会发现Capital One是最完美的案例之一。从1993年到2013年的20年间,这家公司在成熟的金融市场里和银行业巨头们进行博弈,神奇地成长为美国第五大银行,并常年保持了收入两位数的增长。
这背后的奥秘是什么?
百分点大数据学院与痛点学院在9月联合主办的上海金融沙龙上,有幸邀请曾任职于Capital One,现任好买财富首席数据官、金融大数据专家傅晓敏,来分享美国大数据应用的成功和失败经验。
金融领域的“谷歌”怎么用大数据?
傅晓敏认为,Capital One从一开始就定位为技术公司,而非纯粹的金融公司,比大家现在所熟悉的FinTech认知早了20年。第一资本银行作为一个大数据驱动的公司,不断创新和发展,被誉为金融行业的“谷歌”。
金融行业应该是最早利用大数据的行业,归纳成五类:
第一类,征信行业。美国征信发展比较完善,所以大数据在征信行业提供的是补充和加强的作用。但在中国,尤其是在消费金融领域,利用大数据做征信将是一片蓝海。
第二类,风控。风险定价能力是金融行业、信贷行业最关键的核心竞争力,如何用风控提高竞争力,这是大数据技术的用武之地。
第三类反欺诈和反洗钱。欺诈是金融公司不能承受之重,处理不好会让金融行业蒙受重大损失,如何利用大数据来预测和挽回不必要的损失,将是大数据的优势所在。
第四个是营销,如何利用数据实时、动态地将客户个人偏好和产品匹配,是大数据技术非常广泛的应用场景。
最后是服务,每个客户所需要的服务平台和方式、方法都是不一样的,利用社交或者大数据技术来建立一个个性化的服务平台,是必须要走的过程。
模仿成功?重要的是学习失败
实际上,金融行业都在经历着高难度的转型,转型中有痛,也有坑。在参考成功案例外,也有必要借鉴失败经验。
1 先说成功案例:
第一个例子是Capital One精准营销的项目 ,这个案例曾被华尔街报道并被很多公司模仿。
公司业务总是要求不断增长,但销售或者市场总有遇到瓶颈之时,大数据技术到底能不能有效地将客户引导到你的平台上来?
傅晓敏介绍,他们首先要做的,是如何利用各种数据让客户来了之后快速地在30秒之内匹配合适的信用卡。不同人群的上网时间、方式不一样,因此,就需要利用客户的浏览行为来进行判断。
第二,通过上网的信息(比如说IP地址)迅速定位到客户的地点,这个地址可以帮助我们很快地匹配人口统计数据。当时美国刚刚经历了金融危机,房贷的坏账率是和位置数据非常相关的,通过位置信息就可以判断房价等因素。
同时匹配这个人是否为银行已有的客户,历史交易状况如何?将这些数据输入到一个模型里面,形成一个引擎,在十秒之内就能清楚地匹配到很准确的产品,可以将银行收益比例提高30%。
第二个例子是反欺诈问题。
电信欺诈、金融欺诈是非常严重的问题,目前国内从政府到各个层面已经逐渐提高防欺诈意识,同时也意味着很多领域都要做大量防欺诈工作。
那么,怎样快速鉴定欺诈的人群和交易行为?这需要很多的数据支撑。
一个是交易数据,包括海量交易数据、附近商户数据、社交链行为数据,比如刷卡行为发生的时间、交易特征、刷卡商户附近居住的人群社交量的数据,以及与刷卡商户平时发生交易的特定客户的行为特征。不过这个反欺诈是不完全准确的,总会有一些漏网之鱼,也总会因为“假阳性”造成不好的用户体验,这就需要利用多维度数据反复验证、比较、不断优化。
二是建立数据模型,通过机器学习技术,不断加入新纬度的数据来提高模型的准确性,目前已经阻止78%的欺诈行为。但高科技犯罪的人是道高一尺魔高一丈,还要防止他们建立模型进行破坏。
2 再说失败案例:
第一个失败案例是谷歌的,其科学家团队开发的预测美国流感发生趋势的大数据模型,想要根据谷歌五年的历史搜索数据里面的关健词,预测美国流感从什么地方传播到什么地方。
为什么会失败呢?
一是,搜索的人并不知道流感和普通感冒的区别,不一定是得流感的人在搜索,也可能是头疼,而这个模型将此进行了过度关联。
另外一个原因是恐慌因素,比如旁边一个州的人发生了流感,另外一个州的人要做准备,谷歌误认为这个流感已经到这里了,同样是过度关联的结果。
第二个案例,是中小企业贷款的大数据模型。
在美国有几个互联网金融公司专做中小企业贷款。但是中小企业贷款涉及的数据更复杂,而且中小企业涉及到整个行业非常特殊的一些数据,比如非标准的财务报表和不同行业、不同范式的合同,他们没有很专业的知识,是很难理解或者很难有时间把它准确挖掘出来。
当时想用一个很完美的模型把所有的问题都解决掉,比如把市场和信贷的解决方案全部用一个模型来解决,但因为数据的复杂程度,最后证明这种方法是失败的,而且90%的时间都在做数据清理。
这就说明,想通过大数据技术一下子解决所有的问题是很难成功的,而是要用抽丝剥茧、循序渐进的方式。
美国经验能给我们带来哪些启示?
1.大数据是一种技术,但首先是一种思维。
如何在日常商业运作中,把大数据作为出发点,而不是当成技术来考虑,是非常重要的思维转变。
2. 加强基础建设,尤其是数据采集体系。
项目要从一开始就要提前规划,而不是进行到一定程度再找数据。
3. 可视化,可视化,可视化。重要的事情说三遍。
如果数据不能让你的决策层充分或者非常简明的看出它的重要性,尤其是对决策的重要性,基本上就是没有用处的。因此,不管数据有多大,显现出来的效果一定要简洁明了。
4. 小步走,不停地试错。
通过上文的失败案例,我们得到的教训就是“如果你想把所有的事情一下做好反而不会成功”。要通过明显的阶段性的大数据成果带来直接效益,让公司决策层增强信心,这样会让客户的感受度更好。
5. 不断学习,切忌跟风。
技术发展速度快得让人觉得三天不学习就落伍了,这也是很困扰大家的事情。怎么办?
傅晓敏建议,可以关注和追踪新技术的发展,但不要一味地跟风和模仿。如果发现对你有用的方法可以先拿过来做出一定的成绩,在充分掌握现有信息的基础上,再学习和加强对新技术的认知。
End.