DataVisor维择科技吴中:智能风控应用无监督学习解决“黑色产业链”
6月12-14日,为期三天的“2019全球新经济年会”在上海长宁世贸展馆顺利举办。本次大会由上海市经济和信息化委员会、上海市商务委员会、上海市长宁区人民政府指导,上海市长宁区青年联合会、亿欧公司联合主办。大会以“科创引领智能新时代”为主题,聚焦科创板、5G、智能制造等新兴 产业创新 热点。
6月14日, 金融科技 峰会隆重召开,与会嘉宾在“开放银行”、“场景金融”、“产业互联网”等方面的思维碰撞为科技创新企业探索金融科技赋能、落地银行业带来了极具价值的参考。
DataVisor中国区总经理吴中在会上发表了精彩演讲。以下是演讲实录:
吴中:非常感谢今天有这个机会跟大家在此做一个分享。自我介绍一下,我是来自DataVisor维择科技的吴中,我们公司主要做的是提供 反欺诈 的服务给国内知名的企业,包括金融机构。
其实金融风控是一个比较大的范畴,大家比较关心的一般 聚焦在信用风险、欺诈风险这两块。 其实这里面的分类非常多,一般可以按事前、事中、事后这样的场景来分,也可以按信用部分,例如单体欺诈、群体欺诈做一个分类。在金融行业涉及到非常多的过程。
举一个例子,有在事前做的申请工作的恶意骗贷,交易端做的申请信用卡做的养卡套现。在交易平台上有很多非法集资、洗钱、地下钱庄、线上赌博,现在网上做很多的营销活动的时候,也有很多手段去做一些营销的套利,俗称“薅羊毛”,也有结合社交网络做的电信诈骗。这里面有非常多的业务点可以运用我们的技术,解决这里面的风险控制的问题。
我们看到一个趋势,从最开始的单体欺诈,我们更多看一个人的信用,解决个人信用评级的问题,到线下的ATM的侧路,到一些卡的盗取,大家以前的关注点是对个人、个体交易怎么做一个评分。现在我们看到的趋势是, 很多机构更多关注系统性风险。 也就是说,单体的可以通过技术手段做一些有效防控,但是大家更关心的是在这些平台上存在一些隐藏、潜伏、系统性的风险,一次可以造成比较大的伤害。
现在结合很多黑色产业链的发展,实际上有很多的团伙,涉及到很多中介包装,他们会控制很多账号、身份资料,在业务各个环节去做大规模的攻击。比如说有盗取身份、欺诈开户、套现交易、非法集资。一个比较明显的趋势,从个体到群体性,有组织的攻击。
这背后大家日常中不一定能接触到,实际上它背后隐藏着很大的产业链,我们叫“黑色产业链”。我们公司也在做黑色产业链的研究和挖掘,它是一个比较完整的结构,从上游的技术手段,比如说做一些技术工具、卡商、打码平台,到中游的代理IP、外包服务,包括下游有一些能力外包做一些职业的刷单、代理工作室,利用上面的工具做一些“薅羊毛”的操作。应用到各个场景,非常之多,包括刚才提到的账号盗取、欺诈交易、薅羊毛、电信诈骗、信贷欺诈等等。
反欺诈渗透的环境未来不单是金融科技,也许也渗透到电商、社交、游戏、支付等环节里面。 这里面有一部分跟支付金融相关的,有一些包括社交、电商可能跟日常的垃圾消息、网络诈骗关系比较深。
我举一些黑色产业链的例子,现在做多了大家可能会觉得世界上很多东西都可以作假。第一个是可以做信用卡的流水,甚至社保的很多记录都有专业的机构作假,这边有一个虚拟机,包括GPS修改的设备,可以以一定的价格做所有的四件套,身份证、银行卡、U盾等等,也有专门的工具做群控软件等等设备。 我们要对抗的已经不是单个的个体,而是一个比较成熟、有组织、分工明确、有技术能力、有AI能力的黑色产业链。
在这些黑色产业链的控制下,我们看到一些欺诈行为的特点,从我们自己的数据来看,第一个更倾向于组织的攻击越来越严密,利用的技术手段都有一个目的,想把攻击行为做的更加分散,更加隐蔽。不同行业里面表现出来的群组大小不一样,黑产数据上的群组大小也不太一样,金融行业里每一笔做成之后,收益会比较高,我们看到社交、游戏、电商群组更加小、更加隐蔽。
金融行业潜伏周期更长,账号从刚开始注册到真正发生一个攻击事件的时候,潜伏、养卡、等待的时间。 最长的超过半年或者将近一年的时间都有潜伏这么久的案例。
刚才更多讲的是从攻击方,黑产的方面,实际上手段很复杂,很隐蔽,潜伏的很强。我们在现在这个情况下怎么用技术的手段解决这个问题?我们自己的观察,行业内也有一个演变过程,从最开始是大家熟知的 专家系统,它本质上是把很多做风控业务的专家多年的经验形成一些规则,固化到系统里面,对于已知的攻击可以做到很好的防控。
专家系统有一个优势,可解释性比较清楚,你打中了哪条规则是因为什么检测出来的,比较说得清楚。但是它有明显的缺点,它需要不停的、手工的更新知识,发掘最新的黑产怎么样,落到规则引擎里面去。它对待当前形式比较快速变化的欺诈反应是比较慢的,而且需要大量的人工。
很多企业从10年前开始做有监督的机器学习,当然在这个时间点在不同行业可能不太一样。这个逻辑跟上面的有点类似,本质上是积累很多过去的标签,用这个训练机器学习的模型。
优势是它比专家系统会总结出更多人类无法清晰总结出来的规则,但是它也同时受限于标签的积累和时效性。这两种方法在检测新型、未知的攻击模式的时候都会有一些问题。
为了适应这种形势的发展,我们公司包括业内有一个趋势,大家也在看无监督的机器学习的做法,它有几个优势:
一是不依赖于过往的标签,能够比较有效的发现未知的欺诈。
二是能够在生命周期比较早的时间,比如说在它刚注册,刚申请的时候就发现它可能存在着一些异常的行为。
三是,相对于有监督学习来讲,有比较好的可解释性,这种技术抓出来的是一些群组,这种群组可以做一些分析。这个群组里面异常的共性是什么,这是可以用技术手段比较自然的生成。
它可以同时满足这三个比较好的优势。这会在金融风控里面需要做比较好的定性的时候,它有比较大的优势。
简单阐述一下技术原理,如果把平台上所有账号行为,每个账号归结到每个点上的话,普通用户比较分散,每个人做自己行为的时候比较有自己的独立意识,而团伙欺诈会形成异常的聚集点。 我们有一句话叫“好人分散,坏人扎堆”,通过这个原理,包括无监督技术可以有效的在这里面找出欺诈的群组。
大体分四步,包括前面的抽取,中间的建立图,包括每个账号点跟点的连接,每个点连接之后做群组聚类异常判断,然后把同一个团伙群组连接起来,输出相应的得分和解释。
这个是我们跟很多企业合作时候的观察,我们认为整个风控需要比较完整的AI的技术,AI发展到今天并不是某个单一的规则有监督、无监督的逻辑可以解决的。实际上每个模式在这里面都起相互互补的作用,传统的规则跟有监督可以比较好,包括一些黑白名单,可以比较好的覆盖已知的欺诈,它可以比较快的做一些响应。无监督的群组可以比较有效的发觉未知的团伙欺诈,还有异常检测的引擎可以做细分场景的用户画像和评估个体风险。
我们判断在每个金融科技场景里面,都应该结合这个场景选择我们所能看到的AI技术。
很多人觉得我把这个技术讲完了就可以,实际上你会发现在真正落地的过程中核心的技术中间很小的一块,要真正的落地到生产系统里面的场景,你需要从数据收集、数据治理、工程、设备建设是一套的东西。我们从一个核心的技术出发,往产品dCube全面的解决方案往这个平台发展,这里面分成几层,一个是从底层的数据层,包括我们做的数据治理、特征工程的工具,包括欺诈特征库,自定义特征全球智能区域库,中层模型,还可以接入监督的机器学习规则,这一套都是比较重要的。
在这个平台上,不同的角色在整个金融行业里面的团队就可以发挥不同的作用 ,比如说业务处理可以看输出的风控的大盘还有整体情况,去了解风控对业务有什么影响,是不是需要修改产品和业务流程。欺诈风险分析师,可以定点分析中间的欺诈案件,产生一些防范的举措。数据科学家和工程师主要是聚焦在下面的模型,包括建模,数据治理这方面,合规官员可以看中间流程上是不是有操作性的风险。
这里面有一个独特的优势,维择科技的dCube是专注于反欺诈,包含了监督核心技术的 人工智能 的平台,同样的平台技术可以经过不同的适配,可以应用到全生命周期里面去。这是我们在国内外当金融机构,包括美国的信用卡,美国的金融机构,还有国内的财富50强的公司移动支付平台做的一些案例。
这是我们找到的一个薅羊毛团伙案例的情况,可能有800多个卡,绑卡的时间比较分散,潜伏持续了一年,慢慢的在进行。这里面有很多的设备跟银行预留手机账号的集中,包括他们用了一些GPS修改机制,伪造、变换位置,逃避现有规则和名单的查询。他做了什么事情,绑卡之后,800多张卡基本上都会去一些小的店里面去做一些消费,换取薅羊毛的活动积分。
最后简单介绍一下,我们公司叫DataVisor,实际上我们是一个同时在美国硅谷,包括北京、上海都设有办公室、研发中心的公司,我们主要的创始团队是微软研究院,长期做了反欺诈方面的研究。现在整个业务模式是给国内外包括金融机构、互联网机构、社交电商、游戏提供风控和反欺诈的服务,还有刚刚提到的dCube的平台。这是我们在全球到目前为止已经保护的从账号数来讲,超过42亿,除了过的事件超过了8000亿,检测了超过2.2亿的坏户。这是在国内外一些比较典型的客户Logo,像刚才讲的金融、电商、社交、移动、游戏、保险、航旅等等一些新的行业,这是我们在国内外获了很多的奖项,大家可以看一下。
谢谢!
银行与金融科技融合的理想境界是什么?是银行即服务。
2019年6月14日,亿欧智库研究院将在“2019丨全球新经济年会·金融科技峰会”上发布《 2019开放银行与金融科技发展研究报告 》,深度解读金融科技赋能开放银行的融合与落地应用——上海·虹桥·世贸展馆邀您见证!抢票链接: https://www.iyiou.com/post/ad/id/792
版权声明
本文来源亿欧,经亿欧授权发布,版权归原作者所有。转载或内容合作请点击转载说明,违规转载法律必究。