用机器学习做风控的氪信,凭什么获前IDG资深合伙人数千万融资?
随着国内互联网金融监管加强,小额普惠的定位更加明确,以及行业本身规范性的建立,用大数据与机器学习的方式做风控变得越来越重要,相关领域的公司也逐渐受到追捧。
雷锋网(搜索“雷锋网”公众号关注)独家获悉,Fintech公司CreditX氪信最近正式完成数千万元Pre-A轮融资,由IDG荣誉合伙人章苏阳新创立的基金火山石资本领投,真格基金跟投。2015年底,氪信还曾获得真格基金领投的700万元天使融资。
氪信主要用机器学习和大数据分析技术,提供风险信用评估和用户价值运营,为金融公司提供风控与营销决策。氪信的产品包括非或然引擎和XCloud,前者是一个大数据风控决策引擎;后者可以简单理解为以大数据为基础的DAAS(数据即服务)服务。
公司创始人朱明杰告诉雷锋网,本轮融资将主要用于与数据源上下游合作,金融场景与市场拓展,以及团队扩充。
将机器学习用于金融风控
互联网借贷的特点是小额大量,而基于人工的风控成本过高且效率低,这就需要用机器学习的手段帮助做出风控决策。朱明杰认为,现在用机器学习的方式做风控还处于很早期的阶段,对金融客户来说也有一个市场教育的过程,今年开始才逐渐有业务上的需求。他告诉雷锋网,将机器学习应用于风控主要有两方面的问题:
一是数据太多,主要是数据特征维度多。传统风控主要用到与金融相关的特征,一般有数十维度,包括收入、流水和信贷等。而小额普惠金融则需要包括行为数据、APP数据、多头借贷在内的多维数据。
二是样本数据太小,因为消费金融等纯线上形式存在的时间较短,没有传统借贷那样多的样本数据。
氪信的机器学习引擎会是把人的经验和机器能力结合起来。在线上贷款中,虽然数据不足,但风控专家会有自己的逻辑,只是人力审核的量不会很大。通过机器学习把经验复制到机器上,把不确定的东西交给风控专家,这对小额分散的借贷很适用。风控专家会介入到机器学习的训练迭代上,最终模型会自动迭代,对人的依赖也就越来越少,并避免人为操作的道德风险。
朱明杰还提到将机器学习用于风控的 可解释性 问题。我们知道,如深度学习这类技术,虽然在人脸、语音识别上取得了惊人的效果,但关于其原理的讨论仍较少,即不知道为何会有这样的结果。而金融机构特别关心模型的可解释性,一方面是要控制风险,另一方面是要与用户沟通。显然,只给出结果而没有可解释性,是无法被接受的。
雷锋网曾报道,氪信的经验是利用LIME去捕获结果或者局部结果中的关键变量,然后让风控专家迅速的抓到是哪些特征导致结果的变化。
未明杰表示,自去年底产品成型到现在,氪信已与50多家金融机构有合作,包括民生银行、中银消费金融这样的传统金融公司,也有点融网、小赢理财、普金融、雨点金服等互联网金融公司。非或然引擎在传统金融场景上,风控指标的KS值在50%以上,在互联网金融反欺诈效果中KS值也领先。
目前,公司已实现盈利,融资主要是为了未来的而已与平台发展。朱明杰表示,两轮融资的间隔较短,也很快,恰逢章苏阳从IDG退休成立新基金。
不再讲故事的大数据风控
朱明杰告诉雷锋网,此前的很多大数据与机器学习风控其实都是在讲故事,而随着监管的变严,Fintech基础设施这块的服务才刚刚开始,这些底层基础设施包括数据、模型、征信、风控和反欺诈等。
不过他认为这块市场会有很明显的马太效应,虽然未来会有更多公司加入其中,但已起步的团队会存在更大的优势。因为他们有在成熟场景中的检验效果,模型会越来越完善。
做风控有几方面的壁垒,一是人才,二是数据和业务的积累。机器学习模型需要接受金融场景的检验,其效果是技术与业务的结合。
朱明杰认为氪信的优势也在这里。他本人是微软亚洲研究院博士,曾在德国马克思普朗克研究院从事大规模数据挖掘工作,其他技术成员也有成熟的大型机器学习成熟应用经验。另外他们也有非常好的机会,深入到金融机构核心的风控场景中,让产品得到了检验。
目前,氪信的风控引擎主要提供场景定制的服务,未来还会与新浪微财富这样的云金融平台合作,让风控模式实现高效的推广与复制。