百度金融沈抖谈大数据:用科技描摹未来,用技术赋能生活

数据观  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

  “在金融这个相对传统的行业里面,实际已经在全方位使用大数据的能力; 人工智能 、大数据正在成为核心力量,驱动金融科技发展。”12月8日下午,代表业内领先水平的2016中国大数据技术大会召开,吸引了诸多业界精英到场,其中百度金融研发负责人沈抖博士出席并发表了“大数据时代下的普惠金融发展与创新”主题演讲,详细讲解了百度如何利用技术力量全面抢占新一波科技制高点,在金融科技全球化浪潮下实现普惠金融的理想。

演讲实录如下:

听了大家的演讲非常受启发,我也给大家分享一些百度金融最近在做的事情——《大数据时代下的普惠金融发展和创新》。

其实金融是跟我们关系非常密切的一个行业,在这里面既有银行、保险也有证券各种各样非常发达的金融服务,实际上这个相对传统的行业已经在全方位的使用大数据的能力。金融行业从用户画像、精准营销、风险管理、运营优化各个方面都在基于大数据和人工智能发力。

正是因为金融机构对这些大数据和科技能力的需求,整个金融科技得到了快速发展,金融科技领域的投资快速增长,而且这个势头还会继续的进行下去。

金融科技涵盖的内容其实面还是比较宽的,今天挑几个跟大家进行一个讨论。一是安全防护,安全对金融来讲毋庸置疑是非常重要的,接下来是智能获客、大数据风控,最后一个是量化投资。

首先是安全,我们想想黑产怎么去攻击一个正常的用户?首先是APP的破解,在端上入侵,这时候必须做好端上的安全扫描;接下来他们可能会做通信劫持,这时候我们就要做全流量的https;接下来他会通过撞库其或者用其他方式想方设法的盗取用户的密码;最后一步如果偷帐号不成,他就会冒充一个用户,盗取用户的身份信息,这时候就要做好活体识别和生物特征来完成身份认证。

具体讲帐户保护的时候我们怎么做,实际上我们在看一个人的时候,是不是真人真身份,是不是自己在操作,无非是这几个方面在判断:从时间、空间、帐号、行为来判断,把这四个维度综合起来,全天候实时监控,对每天数千万次的登录,数百亿次的访问做安全保护,每次响应时间只需要几毫秒。手写签名是一种身份认证的有效手段,在日常生活中很常见,到了移动设备上,签名更加便捷、高效,因为移动设备上它不只是一个形状,还反映了更多维度,比如行笔的力度、速度等。在这种情况下,即使给一个签名,让别人一点点去描,也能判断不是签名人本人,因为行笔速度和自然流畅度已经不一样了。

  接下来说一下智能获客和大数据风控,无论是现在的 互联网金融 还是传统的金融这都是最核心的两个能力。这两个能力很大程度上建立在对用户的理解上。为此,百度建设了非常先进的用户画像,来全方位的理解一个用户。

智能获客说白了是要找到有金融需求的人,无论是贷款、理财还是其他任何一个需求,我们都需要适当时间点把这个人找出来,要想做到这一点无非是几个事情:1、要有足够大的流量覆盖才有可能触达用户;2、必须对用户有深刻的了解;3、在合适的时机通过大流量触达用户。现在我们对用户做了9大类400多个细分维度全面看这个用户需求到底是什么,此时此刻需求是什么。接下来就可以在每天百亿的流量上面触达数十亿有金融需求的用户,无论他现在是在关注房产、备孕还是旅游,有需求我们就会很好的触达。

在捕捉用户需求的时候,一个很关键的维度是时效性。一方面我们要实时捕捉这种需求,无论通过搜索、LBS还是网页浏览,每天几百T的数据流都要在分钟级完成处理。如果我们发现一个需求触发的事件,认定这个用户有一个借贷需求,那么在当天触达客户,转化率最高,第二天再去触达,转化率就折半了。衰减的原因可能有两个,一个需求变了,更有可能的是,已经有其他金融机构抢先满足了这个用户的需求,他短时间已经不再有这个需求了,所以转化率肯定低了。时效性只是一个维度,智能获客中还有很多维度需要考虑。

除了抓住用户需求,还要看获客成本,这时候就要动态的调整竞价机制,需要不断的根据我们的ROI目标,动态调整出价,在控制成本的情况下,持续提升用户的转化响应率。

为了促成转化,还有一个很有趣的事情是给用户传递什么样的信息,信息的每一句话都会产生巨大的影响。有了大数据支持以后我们就可以做到千人千面:根据用户的兴趣爱好、人生阶段,考虑到整个客户的生命周期、生活品质、消费水平的要求等等,把所有因素综合起来给用户送一个非常个性化的消息。我们做过一个简单的实验,从情感需求、行动召唤、描述等多个方面优化,可以把用户的响应率提升80%多。

关于补贴,在座很多位都曾经是受益者,随着现在O2O以及互联网金融慢慢理性,现在大额补贴是在缩减,但是补贴依然存在,所以获客里面另外一个就是补贴的成本,怎么智能的调节补贴,使得我们在一定预算情况下获得更多的新户或者让更多老户活跃起来。从数学上来看是非常简单的优化问题,就是给定运营成本,最大化用户激活量。通过分析用户画像、消费能力、订单金额、接入设备、商品类别这些维度,判断用户对补贴的敏感度,来决定补贴额度,我们可以看到,通过个性化的补贴可以使补贴效率有大幅提升,这里补贴效率是指一定预算下,能够激活的用户数。

关于大数据风控,我们这里展示了风控中一系列的计量模型,每个模型里面需要关注的变量也不完全一样。

一般情况下模型是怎么迭代的?首先有大量的数据进来,无论是金融服务数据、社交数据、O2O、LBS的,通过数据的挖掘结合行业的洞察就会形成用户特征、企业特征,然后通过很多算法,例如GBDT、DNN等进行训练,最后通过线上验证学到的模型,这样就可以形成循环,不断的优化。与传统金融机构不太一样,一般传统金融机构里面风控模型会用相当长的周期更新它,有了大数据的支持以后,整个模型可以迭代的更加迅速。

除了在自有数据上优化风控模型外,百度也在帮助第三方公司建设模型。在跟多家第三方公司的合作的过程中,风控指标上有了大幅度的提升。

最后我们分享一下关于量化投资,怎么用机器学习的技术建立量化投资差异化的优势。一般量化投资分几个阶段,首先要进行投资标的调研,接下来是标的筛选,建立投资组合,最后做组合风险控制及时调仓做配置优化。在这几个阶段,基于大数据的机器学习都带来了很大的提升。我们通过一个简单的例子来看互联网大数据的贡献。在选股方面,一方面我们用了传统的因子,然后把从百度里面发现的一些相关加进来,我们发现,相比较于传统的因子,互联网信号进一步提升了收益率。

刚才给大家从安全、智能获客、大数据风控、量化投资等方面分享了百度金融现在做的一些事情,这些事情只是整个互联网金融科技里面的一小部分,整个中国乃至全世界的金融科技都在蓬勃发展,在这个过程中我们也愿意跟大家一起把这个事情往更好的方向推进,利用这些大数据、人工智能的技术一块升级传统金融,实现整个普惠金融的梦想。谢谢大家。

 

责任编辑:陈近梅

随意打赏

百度大数据平台百度未来商店百度金融贷款
提交建议
微信扫一扫,分享给好友吧。