【干货】宜信大数据Joyce Zhang:解读大数据金融的玩法
I黑马导读
:我们现在看到各大互联网大佬纷纷进入互联网金融行业,可以说互联网金融的未来是基于大数据的金融,这个所谓的大数据金融可以解救很多互联网大流量公司或者电商平台光有流量或者现金流但不盈利的尴尬,可以说后互联网金融时代就是大数据金融时代,如何利用大数据做金融了?宜信大数据创新中心总经理
Joyce Zhang
给大家分享了关于大数据金融方面的创业经历,分析怎样理解大数据。
近日,宜信大数据创新中心总经理Joyce Zhang给大家分享了关于大数据金融方面的创业经历,并分析了应该怎样理解大数据?
以下是 Joyce Zhang的演讲实录:
Joyce Zhang: 我今天讲的是大数据金融。我自己是去年加入宜信的,加入之前我没有听说过这家公司。他是一家不折不扣的创业公司,现在在全国已经有30000多人。宜信06年从线下起家,包括我们做风控,现在互联网金融很火,很多团队几十万买一个软件就做互联网金融的公司,20多个人做这么一个公司,宜信做风控的有多少人呢?加起来将近2000人,我们CEO是唐宁,他总是说风控是互联网金融的一个根本。我今天来的主要目的是讲宜信做大数据金融是怎么做的。我会和大家分享在美国还没有上市但是即将上市的大数据的信息。
之前,我们总听到互联网金融这个词。但是,这个词已经落伍了,现在是大数据金融比较火。我去年加入宜信很多我的朋友都跟我,你真会踩点,大数据这么火金融也这么火。我做大数据做了很多年从来不知道大数据会变得这么火,去年最厉害的时候我有100多个群,很多人把我拉进各种群,群里面有各种各样大数据群的名字。
怎样理解大数据?
在座的我不知道有多少人学计算机出身的,你们对大数据的理解是什么样的?现在很多文章都在讲这个。我团队里面有个同事,他之前是创业的,后来我来了之后他跟我加入这个团队,在新浪微博最火的时候有几千万粉丝,我这个同事刚刚开始火起来的时候他们做了什么事情呢?他们七八个人全部都是做技术的,没有一个做销售的,加上一个做产品的,他们用爬虫把全中文网上的很多文章,各种各样的文章扒下来,做技术学习和分析,分析后做什么呢?他们在新浪微博大概总共开了3000多个帐号,比如facebook那些事、冷笑话诸如此类各种各样不同的主题不同的帐号,它扒来之后而且还要做缩略,新浪微博只能是140个字,还得显得是人写的,不能是机器写的,里面有很多技术难点。通过这样一个自动的流程把这个东西喂到3000多个帐号里面,高峰时期3000个帐号去重以后8000多万粉丝,其中将近10个月的时间还赚了不少钱,后来新浪不让做了就把他们给封了,所以还是要自己创业,中国很多所谓做平台的公司,比如BAT包括新浪,其实长久来说都不见得很可信。这个地方实际上是一个非常典型的大数据的例子,里面用了很多大数据典型的例子,比如做爬虫,拿来了之后用语音的分析、关联、抽取,放到新浪微博上之后还要分析那些转发,分析之间的关系,还有动态的去调整这个发的频率,这里面一系列都是有很多技术手段的。
讲完这个例子之后,我给大家分享三个在美国做得非常好的几个大数据金融的例子:
一个是Zestf Inance,
它是一个做风控的。他们做了好几年了,拿了很多投资,他们做的是一件什么事情呢?这也是我来宜信做这个东西的信条之一,我觉得一切数据都是信用数据。它会把所有的到它这个地方申请贷款,把所有的在网上的信息,所有触摸过的地方,如果它曾经有些小的网站,把这些全部拿过来去分析,举几个非常有意思的例子:比如说在美国,其实美国人很多人也挺土的,尤其是中西部的一些人,文化水平也不怎么高。在美国如果你写你的东西,尤其我们这样还受一定教育的,你J会大写,这个其实可能我们在座的很多人不觉得是什么,但是是体现了教育程度的。在美国中西部很多人上去写全是大写全是小写,从前在传统的银行业他们不会给这个东西很多的关注,说这个体现了你信用的加权,传统的银行业做风控就几十个变量,这样的变量在那个里面都是忽略不计的,大数据做金融,包括我们团队在做的东西,我所有的数据统统扔进去,让机器自己去学习,也许学出来是几万个变量或者几十万个变量,我自己在这个地方做自适应做调整。
另外一家公司叫Kabbage,
Kabbage是只做这种小的网店的店主,像电商那样的,因为在美国很多这些网店的店主,他在ebay他在雅虎,他卖给谁了,好评差评,他就会去关联所有社交的数据,包括这个企业主,很多很小的网站,虽然在ebay上非常小,但是他们都在facebook和推特上有自己帐号的,他们会把所有的这些东西拿过来之后,这些小企业主如果有自己的网站,一起关联起来做分析。这就是Kabbage,它号称是7分钟放款,我上个月刚刚回美国,他说因为各种各样的原因,所以很多时候他们还是不能做到7分钟放款,美国的银行并不比中国高效多少。
还有一个 Lending Club,
做的是P2P贷款,它把这些人群拿过来,关联所有在网上的信息,不一定是网上的信息,Lending Club做的一件事情是别的人没有特别去做的,他们关联很多线下的信息,美国的邮政、超市,那种渠道买回来的信息,线上线下都会做关联,评出风险等级,这个人决定要不要投的时候可以去关注风险等级,这是三个在美国做得非常典型的大数据金融的案例。
我的团队来宜信做什么?
这么多年我在微软的时候做的是精准广告+内容推荐,来宜信后我的想法就是我用同样的技术手段来宜信做风控,风控是互联网金融的根本。现在中国很多互联网公司的状况还不是那么地好,所以需要这么高的成本。我们很多90后在迅速地成长,互联网的状况是在好转,所以我们还是在互联网、移动手机上有很多数据的信息可以做。
我今天没有办法分享太多,因为现在在座很多反欺诈的东西是不能分享的,反欺诈从来都是道高一尺魔高一丈。我们可以分享的是在座大数据所谓的风控决策引擎,另外一个是利用大数据实时授信。基于关键词的搜索,我们宜信老说这是一个金融公司,但是内部我们说这是一个屌丝金融公司,这些人在网上的信息是非常少的,谷歌在做这个东西,我们也在做,我们做的是长尾的,我们会把所有网上的信息拿回来之后加上我们自己的信息关联,加上第三方渠道合作的信息,做客户的画像,还做客户关系的关联,得出这样一个知识图谱之后,我去做风控或者我做决策引擎或者反欺诈或者推荐引擎。在座不知道有人用51信用卡这样的app吗?51信用卡在中国号称有几百万的活跃用户,有几千万的注册用户,因为我有信用卡的流水,之后做机器学习的模型加上点上购买的记录,加上所有的社交信息,我们在做这样一个贷款
。
扫一扫,每天一点点,了解互联网金融时代大趋势!
感谢关注最有价值的金融微信:I黑马互联网金融与风投(
iheimajinrong)
大家可以叫我“金融哥”,如果你想玩转互联网金融,
请加入互联网金融行业QQ交流群:
346320036
如果您喜欢我们的文章,请点击下方分享到微博或者微信朋友圈.
作者:
Joyce Zhang
|