AI 金融「新十年」:风向、思考、理念丨CCF-GAIR 2020
2020年8月7日-9日,第五届CCF-GAIR全球人工智能与机器人峰会,于深圳隆重举办。
此次峰会由中国计算机学会主办,香港中文大学(深圳)、雷锋网联合承办,鹏城实验室、深圳市人工智能与机器人研究院协办。
在大会第三日的「AI金融专场」中,《AI金融评论》邀请了6位最具代表性的顶尖AI金融专家,分享能够代表未来10年风向的智能技术方法论、产品逻辑和风险管理理念;也在2020这个特别的时间节点上,展望他们眼中的「AI金融新十年」。
微众银行首席AI官杨强:联邦学习,重塑金融范式
大会开场,微众银行首席AI官杨强教授首先登台演讲。
杨强是国际联邦学习与迁移学习的领军人物,也是国际人工智能联合会(IJCAI)成立50多年来,首位华人理事会主席。
微众银行目前已经有五年的经营历史,有大约两亿的个人用户和将近百万的小微企业客户。作为微众首席AI官,杨强教授认为微众银行之所以获得如此大规模的用户群,很大程度上是取决于技术上的创新,包括云计算、大数据和人工智能。
他表示,获客、客户信用评估、客服等金融业务都有AI的影子,这当中的主线就是“如何将尽可能多的数据顺利使用起来”。而联邦学习这种“数据不动模型动”的做法,能实现“数据可用不可见”的目标,更好地助力金融。迁移学习和联邦学习也是如今比较突出的两项技术,可以把整个金融业务再往前推进一步。
杨强认为,目前很多行业并没有真正意义上的大数据,缺乏高质量、有标注、不断更新的数据。
如何保证各方数据私密不外传,又能保证数据更新?这就是分布性数据隐私保护、联合建模的挑战和需求——把小数据聚合起来成为大数据。加上现在人们愈发重视隐私,政府纷纷立法,对技术的监管趋严,联邦学习正为保护隐私带来了技术上的新思路。
如何理解联邦学习?“邦”是指每个实体参与者地位相同,无论大小,提供的价值才是他们存在的意义;“联”是用一种方式把它们联合起来,保护隐私,一起做有意义的事情。
联邦学习的宗旨是“数据不动模型动”,目标是“数据可用不可见”。数据可以用,但是这些原始数据是合作方彼此之间见不到的,所以一些散乱的小数据就可以成为虚拟的大数据。
杨强教授介绍称,目前联邦学习主要有横向联邦(样本不同、特征重叠)和纵向联邦(样本重叠、特征不同)两种做法,前者更适用于to C场景,后者适合to B场景。
他强调,联邦学习和分布式AI、联邦数据库的区别在于:过去这二者的数据形态、分布、表征皆为同类,但在联邦学习里它们可以是异构的;且过去联邦数据库目的是并行计算、增加效率,但现在数据本身属于不同的属主,所以需要做加密情况下保护隐私的计算。
最后,杨强谈到了联邦学习在金融领域的应用。除了推荐系统,联邦学习也可以在征信系统和信贷业务上发挥作用,银行提供用户贷款的关键数据,合作方提供企业的交易数据,两方数据后联邦可让坏账率大幅降低。在保险业,则可以让不同的保险公司可以横向联邦,更好地建立个性化定价模型。
平安集团首席科学家肖京:1%的效率提升,100亿的价值创造
紧接着,平安集团首席科学家肖京博士上台发表演讲。
肖京博士长期从事人工智能与大数据分析挖掘相关领域研究,目前主持平安集团的AI赋能与技术创新工作,包括智能化大数据分析等技术在金融、医疗、智慧城市等领域的研发和应用。
他曾经指出,运营上1%的效率提升,就可以给平安集团带来100亿的价值——全集团180多万员工,每一点效率的提高带来的收益都十分明显。
现场,肖京以「人工智能赋能金融业务」为主题,同与会者进行了分享讨论。
他指出,金融市场目前面临越来越多的挑战和诉求,随着监管趋严,互联网和高科技企业、传统银行等金融机构的竞争愈加激烈;未来银行不管在体制还是技术上,都会更加开放,同时,金融机构的投融结合将成为明显的发展趋势,平安的经营管理也将逐渐向混业经营、精细化、轻资产化转变。
肖京博士分享称,线上化和多线联动使平安集团实现渠道的实时触达,起到降本增效的目的;而智能化、尤其是AI技术的研发及应用,让集团真正实现数字化经营,形成业务生产和服务流程的重构。肖京认为,技术要和业务紧密结合,不光要形成具体解决业务问题的智能化方案和平台,更要形成规模化拓展AI应用的能力,覆盖各类场景,快速有效地实现业务环节的智能化,持续夯实关键技术和业务壁垒。
他还透露,现阶段平安主要在进行智能化业务方案中台的建设,将技术与业务深度融合,抽象浓缩成中台组件,帮助业务快速组建前端服务机器人,将AI算法应用于不同的业务场景。“平安脑”智能引擎作为其核心框架,高效赋能集团各业务单位完善智能化建设。在此之前,平安前后花费了近一年时间,打通了集团内部的数据孤岛,整合到一个平台上,并建立了自动更新及质量控制机制,对原始数据自动化进行脱敏、整合、清洗、标准化等处理,并对这部分数据采取严格保密管理,建立有关数据安全、隐私保护的管理规范。
此外,肖京博士也谈到了联邦学习技术。平安已经推出蜂巢联邦智能平台,以解决“数据孤岛”情况下数据不可共用的问题,平台具有安全性、隐私性、合法性的特点,目前已应用于动态保险定价、专属语音客服等多个场景。同时肖京也提到,联邦学习需要加密、分布部署、改变模型等具体细节,在沟通、开发、部署等各方面成本都较高,只有在必需的场合,平安才会使用联邦学习技术。
在此次大会上,肖博士详细分享了不少平安的人工智能技术应用,比如多模态身份认证,准确率高、稳定性优、适用范围广,已应用于普惠小额贷款、银行保险账户开户、门禁等多个场景,通过微表情、人脸识别等技术提升平安普惠的放贷效率,将放款时间缩短至3分钟,违约率也大幅下降;平安的企业大数据知识图谱欧拉图谱,构建了专业的债券违约、财务造假、企业评级等多个模型,实现贷前贷中贷后、投前投中投后等业务领域的风险管理,预警防控企业金融风险;平安的图像识别技术也已经在车险理赔中发挥重要作用,其应用不仅可以在理赔早期就识别出欺诈的风险,每年减少几十亿元的风险渗透,还提升了业务效率,优化用户体验。
京东数字科技集团副总裁程建波:AI时代下的风控理念
随后,京东数字科技集团副总裁、风险管理中心总经理程建波,深入讲述了AI在风险管理中的应用实践。
程建波先生先后就职于深发展银行、华夏银行、FICO等机构,具备传统金融与互联网跨行业经验,对行业有广泛和深入的了解,业务实践经验丰富。2014年8月,程建波加入京东,组建京东金融风险管理团队,推进了京东白条、金条等系列有行业影响力的产品的发展。
他分享了很多颇具建设性的风控思路和理念。
-
风险不仅是控制,更是主动选择的经营管理。
-
管理风险意味着机遇。风险管理做的好不仅可以止损,还可以带来很多的商业机会。
-
好的风险管理不是滞后的,而会更具有前瞻性。学习的过程是终生的,更需要预见式,而不是反应式。
在大会现场,程建波首先和与会嘉宾分享了京东数科的三个阶段:数字金融、金融科技、数字科技。三个阶段里,不变的核心是一直将数字当作基因,不做和数字无关的业务。
程建波强调新的技术一定要放在商业实践当中反复打磨,尤其是在线上业务中,风险管理的模式和传统相比有很大差别,虽然依然在解决一些老问题,比如信息不对称、如何了解用户、如何让大家理解产品并且使用。但是新的风控模式已经打破了以前的路径,企业仍需要做很多促进消费者理解的工作。
此外,程建波认为有体系的产品建设十分重要。当技术积累到一定程度,比如微众银行建造的模型高达60个,最大的挑战是庞大的技术团队如何管理,比如平安的业务很大,1%的变动,就是几万亿的规模。这不再是单纯技术的问题,还需要构建一个复杂的框架体系,并且需要多团队联合作战。
关于风控,程建波也向与会嘉宾分享了许多自己多年来的实践经验和思考。
他认为风险一定是滞后的。如何在风险不断裂变的情况下更快速地预测用户的风险等级,对于风险管理人员来说是非常重要的,需要更多的技术储备。
程建波还十分重视人才的培养和建设。他认为所有新兴的商业,对人才的要求都是全方位的,第一是和策略相关的专家,第二是AI科学家,第三是大数据的专家。
原摩根大通执行董事黄又钢: 小微贷款风控模型中的算法探索
第四位演讲嘉宾,是华尔街知名建模和风控专家黄又钢。
他曾任摩根大通执行董事和花旗银行高级副总裁,拥有数十年的海外零售银行数据分析经验和前沿算法思维,今年回国与金融界顶尖技术大牛王强博士联合创立了弘犀智能科技有限公司,出任首席风控官。
以《小微贷款风控模型中的算法探索》为主题,黄又钢和嘉宾及与会朋友们分享了自己在风控实践中的一些心得体会。
黄又钢认为,中小微企业解决了国家80%的就业,这些企业的生存和贷款需求问题是需要关心和全力解决。但和上市的公司相比,这类企业信息透露不够充分,数据来源纷杂,数据格式不标准,数据更新周期不稳定,导致面向中小微企业的信贷产品难度更高。中小微企业信用贷款是一个世界性的难题,除了有国家层面的政策扶助,更需要顶尖人才的智慧和付出。
在现场,黄又钢主要介绍了集成算法,降维算法、聚类算法和决策树算法。他指出,现在弘犀智能建任何模型一定是“双轨模型”, 即两个算法同时进行。
主模型是传统模型回归算法,挑战者模型是机器学习算法。无论在美国还是中国,经典风控领域全都是以回归模型为主导,原因在于稳定性好,可解释性非常强。机器学习由于很难被解释,在美国的信贷场景基本不能合规落地。
黄又钢解释了实操“双轨”建模中的几大过程:一是预测能力的比较; 二是变量维度的判断;三是对比同一个观测值,如何交叉使用;四是策略应用,即如何使用这个模型。通过模型、变量、维度和个体等层面的比较,他给出了机器学习相较于传统模型的优劣性分析,表示机器学习在准确性等方面比传统模型要好,没有概念和业务场景的限制;当回归模型与机器学习的结果冲突,适当配置后端策略是可以解决这样的问题。
黄又钢指出人群分类在建模中的重要性,任何人群中都有可能包含不同的子群体。如果仅在全局人群上建一个模型、一条回归线很难解决所有问题,而将人群分类后做独立测试可能会更好地预测风险。决策树算法和聚类算法是人群分类中经常用到的算法,前者用树的方法把人群分为多个叶子,每个叶子表示一个子人群;从机器学习角度来看,决策树算法和聚类算法分别代表有监督学习和无监督学习。
他认为,人群分类的概念听起来非常简单,实际操作相当复杂的。最终结果的评判标准一般是两个方面,一是算法层面的比较,二是预测准确性层面,特指各子人群模型汇总到全局人群上的预测准确性。
黄又钢还分享了算法探索与创新方面有两个思路:一是单一的算法,从数学角度和(或)计算机角度,产生新的突破;二是两种(或多种)算法的相互嵌入和混搭形成新的算法。从实际应用的层面,“匹配”可能会更快地实现突破, 即现成的算法匹配特定的人群和特定的特征,就可能产生非常成功的应用,比如CNN算法在图像识别上的应用效果就是一个事例。
他最后总结称,未来的方向是“算法+人群+特征”,也即,算法的突破,人群的细分,数据的深挖,及相互之间适当的匹配都可能产生革命性的突破。
移卡集团副总裁奚少杰:支付企业的商业全链数字化赋能逻辑
随后演讲的嘉宾,是移卡集团副总裁奚少杰。
移卡是中国第二大二维码支付的服务提供商,有14%的二维码支付市场份额。截止2019年12月31号,移卡有530万的活跃支付商户,触达3.68亿消费者。作为移卡集团副总裁,奚少杰专注于中小微企业的数字化转型和商业服务,他本人也曾在腾讯任职多年,有着丰富的互联网和金融科技从业经验。
现场,奚少杰为与会者带来了题为《数字化转型下的金融科技应用》的主题演讲。
奚少杰首先叙述了第三方支付的发展历程,并认为简单的支付入口,比如二维码,已经不能满足整体的数字化升级的需求,他提出未来几年“产业支付”将驱动行业迎来新的一波发展。
从技术角度(需求端和供给端)和宏观角度,奚少杰详细介绍了产业数字化升级的趋势,目前移卡不仅仅是单一的支付服务商,还逐步会成为综合的数字化服务商。这个服务不仅仅包括支付环节,还包括获客、留存、供应链等商户经营全链条的打通。
奚少杰向与会者介绍,目前移卡也给商户提供了很多不同业务板块,包括基于SaaS的智能餐饮经营管理平台——智掌柜,涵盖点餐、收银、后厨管理、外卖、会员营销、营业报表等一体化功能,提高商家经营效率;基于区块链技术的商户优惠券聚合平台“约惠圈”,可以为商户提供优惠券创建、分发、领取、分享获客服务,助力商家打造私有流量池;支付和商户服务“好生意”,通过连接多种支付方式,帮助商户实现集中收银和一体化账单功能,同时为商家提供店铺管理功能,布局商户服务。
在金融服务和风险管理方面,移卡在提供支付服务的过程中,结合了人脸识别等生物识别技术,这些技术在支付过程中为客户的风控、反欺诈、精准定位方面发挥了很大作用。
在智能经营管理中,企业如何切入其中并为商家提供服务?奚少杰举例称,与商户合作时,可借助基于AI视觉识别的门店热力分析技术关注店铺的热点区域、到店客人的行为、商品陈列等与营业情况的关系,以帮助商户更好地管理会员、经营店铺。
基于积累的数据,移卡还可以给商户提供精准的营销服务,提供客户留存、会员留存等服务;基于对商家的精准评估,可以提供贷款等金融产品的服务。
普林斯顿大学教授范剑青:站在最高维,透视AI金融的运行本质
本次专场的最后一位重量级嘉宾,是普林斯顿大学金融讲座教授范剑青。
他是国际数理统计学会创办70年以来第一位华人主席,论文引用数多年位列世界数学家前十名,是素有统计学诺贝尔奖之称的CPOSS总统奖得主,也是《计量经济》、《商务统计》、《统计年鉴》等五个国际顶尖杂志的主编。
在大洋彼岸的范教授,通过实时连线的方式,以“机器是怎么学习金融的”为主题,带来了长达1个小时的精彩报告。他从大数据与人工智能、稳健因子学习及其应用、债券风险溢价预测、高频交易预测,文本分析与金融投资,这五个板块向大家报告近年来他的研究团队的部分工作成果。
在范剑青看来,人工智能是机器学习的平方,让机器自动学习机器算法、是机器学习的理想境界。而大数据赋能AI,从大数据相关的科学挑战衍生的新兴科学即为数据科学,他认为数据科学以应用为背景,其目的是想把大数据解决成智慧数据。
他指出,大数据=系统+分析+应用,机器学习=统计+优化+实现环境。
如今深度学习之所以能如此成功,范剑青认为它是权衡偏差和方差的有效方法,深度网络使高维函数更加灵活,而现在计算技术使大数据深度学习得到有效的实现。
范剑青认为,在经济金融、生物医学、管理决策和人文社会中,机器学习有很多挑战和机遇。由于个体差异大,数据集未知,现在发生的事情与几年后的变量完全不一样,难以提取特征,需要各学科交叉。尤其是在金融行业,数据不平稳,随着时间而变,多人参与竞争的市场也是对金融的挑战。
而机器学习本身就是为降低维数和预测而设计的,他认为机器能学习金融,尽管金融非常复杂,但它的形式是可预测的。以股票收益预测为例,可以通过高维线性模型、机器学习模型或是深度学习模型来处理。他强调,成功预测的属性一是大数据,二是鲁棒,三是模型具备市场的重要特征。
他还详尽地用几个例子来说明溢价预测相关的问题,例如通过市场因子来预测债券风险;并介绍了现阶段可以使用的两种因子学习方法,一是传统主成分方法,二是利用投影主成分来操作。
此外,范剑青也与现场观众介绍了文本数据如何协助股票投资决策,他表示现在可以通过对新闻内容的分析,解析文章对股票的褒贬程度。
最后,范剑青总结称,资产定价本质上是预测问题,机器可以学习金融。他认为机器学习可以帮助处理大数据并从中选择重要因素和特征,能很好地应对过度拟合的问题,允许非线性学习极大地改善预测效果,将稳健性和对抗性网络提炼为定价,智能预测也会带来很大的经济收益。
历届「AI金融专场」,均会吸引中国及欧美地区众多AI金融专家到场。在上一届论坛中,加拿大工程院院士、Citadel首席人工智能官邓力博士,加拿大工程院院士凌晓峰教授等多位重量级人物来到现场学习交流。
杨强和黄铠在会场热切交流
而在今年,包括黄铠、刘江川、王强等十多位IEEE Fellow以及各大金融机构的首席信息官/科学家来到现场,共同促进AI金融的产学融合与商业应用。 (雷锋网 (公众号:雷锋网) 雷锋网)
黄铠教授在AI金融论坛的现场
。