数美科技联合创始人梁堃:构建全栈式智能风控体系
在FUS猎云网2020年度人工智能产业峰会上,数美科技联合创始人梁堃以《在线业务安全的挑战与实践——构建全栈式智能风控体系》为主题发表演讲。他表示,随着各行各业提速线上化,整个风险在行业中无处不在,业务、营销、内容等方面都面临越来越严峻的安全挑战。
他表示,今天面对黑产、面对欺诈,它们已经不是单兵作战,而是一个完整的黑色的产业链条,它们分工非常明确,每一块都是非常专业化的。“我们曾经打击过一个黑产,他们一夜之间可以换一百多万个不同的IP,遍及国内几十个大中小城市。”
梁堃认为,现有风控方案面临着防御能力单薄、标准难统一、防御时效性差和防御进化慢四项挑战。针对这个行业痛点,数美科技研发的全栈式风控体系,分为布控体系、策略体系、画像体系和运营体系,目前已经应用于银行营销、银行支付、直播和餐饮零售领域。
近年来,业务、营销、内容等方面都面临越来越严峻的安全挑战。数据显示,网络欺诈损失占GDP比例多达0.63%约4000多亿人民币。据测算,黑产从业人数超过150万人,市场规模高达千亿级别。
梁堃表示,2016年上半年,数美科技有一个季度都在跟黑产进行激烈的对抗,逐渐发现只用一个点跟黑产对抗是非常难的,首先在一个点跟黑产对抗的时候,设防的模型特征、策略,对手都会很清楚,这样的情况下很难持续对抗。其次在一个点设防,很难达到对全局风险控制,一旦这个点被绕过,后面就是一马平川,再去控制已经为时已晚。
“在风险控制中最关键的一点,就是即使在最恶劣情况下,我们仍然能对全局的风险有所控制。只做一个点的布控是很难保护全局的,所以我们推崇全栈式的风控体系。”梁堃说。
10月16日,FUS猎云网2020年度人工智能产业峰会在北京金茂万丽酒店隆重举行,近百位知名资本大咖,独角兽创始人、创业风云人物及近千位创业者共聚一堂。
本次峰会由猎云网主办,猎云资本、企业管家、猎云财经、锐视角协办。峰会以“AI UP!”为主题,聚焦人工智能产业的应用,通过展示多领域多维度人工智能技术和产品以及分享讨论AI在不同场景中最新落地应用,展现人工智能产业落地应用的最新成就;并围绕人工智能产业的“进击”与“破圈”,探讨AI技术如何为产业赋能。
以下为梁堃演讲实录,猎云网整理删改:
从2013、2014年开始,整个互联网行业出现两个比较明确的趋势:,从4G网络开始,包括购物、出行、教育、金融、医疗等各行各业都把自己业务做在线化、做互联网化;交易成单型原来最经典的场景就是我进到咖啡店,我给钱他给咖啡,一笔交易完成了,我拿着咖啡走出咖啡店,咖啡店也不知道我是谁,也不了解我的购买习惯和新的需求。但是注重用户运营是说,企业都会通过一个APP把自己用户运营起来,包括像星巴克,他们去年开始有这样的应用,通过手机应用程序,让用户在上面点单,把用户运营起来,让用户跟企业的交互变得更多,给用户提供更好的服务同时,也能让企业获得更多单。
在这两个趋势下,比如营销活动,要运营自己用户的时候,不可避免要做各种各样的营销活动,这样也就面临着各种非常专业的黑产的袭击。在内容层面,各家平台的UGC内容百花齐放,这些内容是否合法合规,对平台而言也成为一个比较严峻的挑战。
我各举一个例子:
随着交易线上化,我们每天的绝大多数交易都是通过在线支付,我们可以看到整个第三方在线支付交易的规模不停上涨,与此同时,整个欺诈交易量和导致的损失也在快速上涨。
我们在做营销活动的时候,核心只有两类——拉新和促活。拉新活动,你的底层逻辑是花钱买用户,专业的黑产就可以造一些虚假用户卖给你,在去年和前年,我们有很多客户都做这种营销活动,他会发现一件事,自己花了大部分营销费用,到最后用户留存率不高。有时候,他们觉得是不是营销活动或者目标人群不太对。但是你会发现,在参与这些营销活动人里面,50%甚至70%的人都是黑产的机器,它拿走这个套利之后再也不回来了。很多时候他们留存率还是不错的,只不过参与这个营销活动的真人占比是非常少的。促活或者留存活动,你的底层逻辑是花钱买活跃度,黑产就可以通过机器人的方法,通过各种各样假的资源造活跃卖给你,从而把你的营销费用套走。
2017年中旬开始,我们已经看不到个人黑产形式,现在不同的APP都在用更加丰富的形式来运营用户,每个用户都可以发表评论、可以换自己的头像,有些信用卡的封面,客户都是可以自定义的。也会有直播或者是语音视频的形式来跟用户交流,内容生产形式越来越多,这些内容里面合规的问题就会成为一个非常麻烦的问题。
我们曾经打击过一个黑产,他们一夜之间可以换一百多万个不同的IP,遍及国内几十个大中小城市。
目前,传统做这种风控常常依赖黑名单,依赖简单的人工规则,依赖一些单点防控,像SDK、验证卡等等;每一个审核人员,或者审核内容是不是黑产,很难统一。传统的统计学习、机器学习的算法,深度学习的算法,你会发现模型的训练至少要到T+1,而且更麻烦黑产样本总是少的,你的样本要积累足够多,才能完成这个训练。缺乏策略迭代闭环和无自学习机制。
2016年上半年,我们有一个季度都在跟黑产做激烈的对抗,逐渐发现你只用一个点跟黑产对抗是非常难的,首先你在一个点跟黑产对抗的时候,你设防的模型特征、策略,你的对手很清楚,这样你跟他PK就很难。其次你在一个点设防,很难达到对全局风险控制,一旦这个点被绕过,后面就是一马平川,你再没有什么去控制这个风险。
所以我们提供全栈式的风控体系,主要包括以下部分:
就是要在多个点做布控,在启动的时候看有没有问题,在注册、登录和业务行为的各个地方都看看有没有问题。每一个地方如果有一百个特征,这些特征组合起来,你会发现有多少个特征。当黑产再想要探测你的特征,需要的资源就是几亿、几十亿的资源。
其中,风险行为检测是基于软硬件特征、上网环境、设备指纹等100+原始数据维度、11亿+的设备样本库,采用聚类分析、GBM、设备相似性识别等技术构建风险设备识别模型,有效识别 虚拟机、多开、篡改设备 等高风险设备;风险内容检测是基于深度学习,理解语音、视觉、文本等形式的内容语义,同时识别三级、数百个不同的违规标签。欺诈团伙检测是基于设备、IP、WIFI等建立时域关联网络,利用社群发现、风险传播等无监督算法发现黑产团伙,识别潜在和新型欺诈威胁;画像体系,构建的风险画像体系,多个场景数据打通,多行业联防联控,共同高效对抗黑产。
在风控这件事情上,首先我们的系统跟传统的SaaS软件不太一样,传统的SaaS软件上线那一天工作基本上结束了,后面就是一些维护相关的工作。我们这个软件上线那一天,它的工作刚刚开始,因为我们要跟整个黑产做持续的对抗。
其次,我们风控系统调用跟业务系统低重合,风控系统是独立的提供系统,这样的好处是风控规则和业务都可以做到非常快速和灵活的调整,互相不影响。
我们永远不会用同一个模型去完成所有的风险的识别,从场景行为事件进来,会经过无监督学习、会经过专家系统和经过有监督学习,这三组模型的结果会再融合到一个上层模型里面去,再用专家规则做出最终的风险决策。
最后是整个风控反欺诈网络,现在构建六个集群在内的全球风控网络,这些模型参数是互相同步的,同步时间是在百毫米级别。
最后,快速介绍一下数美科技,我们成立于2015年,总部在北京,在上海、深圳、杭州有研发中心,现在致力于做一件事情——基于人工智能为企业提供风控和反欺诈服务,现在已经服务了全球上千家不同的客户。