清华教授邓志东谈AI金融:算法已经成熟,垂直应用关键在于大数据
“人工智能产业发展有四个维度:场景、大数据、计算能力与算法。大数据是基础,计算能力是前提,算法靠人才,场景的选择最为重要。从商业化角度来说,人工智能金融就是大数据金融。因为应用中的基础算法都是相对成熟的深度学习算法,可以通过招聘人才来进行调优,计算能力可以全球购买;在场景已经细分确定的前提下,承载行业顶级专家知识的带标签的大数据就显得尤为重要。”
近日 在 上海举办的金融科技峰会上,清华大学计算机系教授、博士生导师邓志东在“人工智能:智能金融与黄金时代”演讲中表述了 上述 观点。对于外界来说,邓志东教授更为人熟知的成就可能来自自动驾驶领域——自2009年起带领团队开发了三辆具有感知和自主决策功能的自动驾驶汽车。而事实上,据雷锋网了解,在人工智能与金融结合领域,邓教授也颇有心得,他笑称“关于智能金融,我已经讲过六七次了。”
邓教授认为, 时代的进步造就了A(人工智能)B(大数据)C(云计算),而大数据、大计算与深度卷积神经网络结合起来,成就了人工智能的伟大复兴。
他表示,作为一种感知智能,深度卷积神经网络能最好地模拟生物视觉通路,在完备大数据与超强计算硬件的强力支撑下,通过多级多层特征的自动提取,已在计算机视觉、语音识别、自然语言处理、自动驾驶、大数据分析等诸多方面,接近、达到乃至超过人类水平。
此外,以AlphaGO为代表的深度强化学习,已具有超人类水平的博弈类决策能力。未来需要探索和突破的主要研究方向,包括“特征提取+认知推理”的小数据深度学习方法,可解释的深度学习方法,具有语义理解的深度学习方法以及具有多任务学习能力的通用人工智能等。
中国人工智能发展的优势与短板
随着AlphaGo的横空出世,人工智能商业化落地的速度不断加快。邓教授认为,在未来5到10年时间内,包括深度卷积神经网络和深度强化学习在内的深度学习算法,将会逐渐释放出真正的商业价值,赋能产品、企业与社会。 比如,基于大数据人工智能,LFW人脸识别率已提升到人类水平的97.6%,现在最新的人脸识别准确率已经达到99.8%,可以应用到银行开户、支付、取款等各种场景。此外,人工智能在医疗、零售、会计、审计、制造业、物流、翻译等行业都大有可为,可提高效率,降低成本,因此也有不少职业面临被机器取代的风险。
在中国,邓教授指出,人工智能发展存在几大优势。 一,应用场景规模大,且商业落地很快。二是中国“互联网+”发展迅猛,拥有更多的海量大数据。“大数据被称作是人工智能新时代的原油,从这点来看,银行本身还坐拥数据金山。”三是政府支持力度大。
而同时,我们也需要正视发展短板,主要体现在四方面:
-
一是中国原始创新能力不足,关键性基础算法和高端芯片缺乏;
-
二是AI高端人才比较稀缺 ;
-
三是投资界过于追求短线逐利,国外的AI收购几乎都是十亿美元起步,对技术与产业趋势的把握敏锐超前;
-
四是体制机制障碍,国有巨头型企业对AI的前瞻性布局不多,投入少,大部分仍在观望之中。邓教授类比互联网时代巨头或初创企业对于互联网经济所持的各种态度:“有不屑一顾的,有观望的,有冷漠‘理性’的,有嘲讽的,当然也有全情投入的”,“全情投入成就了BAT。相信再过三五年,一定也会有全情投入的人工智能巨头出现。”
算法已经成熟,垂直应用关键在于大数据
具体论及人工智能对金融的影响,邓教授表示,“互联网金融正在向人工智能金融发展,因为现在互联网金融网上消费的用户体验其实不算好,都是些下拉菜单,线下门店的人工服务相比更加自然亲切。下一步可以利用人工智能,改善线上的用户体验。此外,深度学习也会改变金融服务的产品形态与流程。”
"人工智能产业发展有四个维度:场景、大数据、计算能力与算法。大数据是基础,计算能力是前提,算法靠人才,垂直应用领域要细分,要细分到具体的问题上。”邓教授告诉雷锋网。
“从商业化角度来说,人工智能金融某种意义上就是大数据金融。因为应用中的基础算法都是相对成熟的深度学习算法,可以通过招聘人才来进行调优,计算能力可以全球购买;在场景已经细分确定的前提下,大数据就显得非常重要。而这部分需要行业顶级专家的深度参与,通过大数据的清洗、标签,实际把行业顶级专家的知识转移给机器,从而让人工智能站在巨人的肩膀之上。”
他指出,金融大数据大多是结构化或半结构化的表单数据,数据质量高,并且已较早实现了大规模数字化、网络化采集与存储,具有相对较多的大数据历史积累,这一点与其他行业不同。
但值得注意的是,交易数据虽然很多,但是带标签的很少,所以“在大数据没有标签之前,还谈不上人工智能,一般是在利用数据挖掘等传统方法来做大数据分析。”
数据货币化的战争
数据货币化会成为颠覆金融业未来的八大驱动力量之一, 数据流的价值将显著提高, 世界经济论坛(WEF)今年8月发布的一份名为“金融服务颠覆式创新”的报告指出。 “ 多种数据源的动态、静态数据集将会愈加丰富,拥有和控制数据将成为所有利益相关者的关键能力。”
但获取这种关键能力是一场场艰苦的战斗。
譬如,保险行业正在受到保险科技的崛起和客户基础结构转型的挑战,联网设备不断增加,但是消费者并非主动自愿提供个人信息,这说明保险公司未能让客户相信联网保险服务符合他们的利益。
在借贷领域,新的数据来源和分析使用方法得以覆盖银行客群之外的长尾客户。但对于传统金融机构来说,首先面临着非金融机构的竞争威胁,国内有阿里借呗、京东白条,国外有亚马逊商家信贷;再者获取的 弱金融属性数据 在改进成熟客户的承销方面的效果有限, 此外 这些数据通常是非结构化和孤立的,在投入使用之前,还需要转换大量投资数据,自动化和新的分析手段。
论及借贷 的 关键环节——风控,据雷锋网观察, 金融科技公司常宣称自己是“ 人工智能风控”,而银行对外多提及“大数据风控”,并表示在数年前就已经开始应用类似手段,只是那时还没有出现”大数据“这个定义。
邓教授的观点或许 从一个侧面解释了这个现象,“这里的所谓大数据风控可能并没有使用标签数据,即没有闭环利用基于标签的深度监督学习及由此获得的行业顶级专家的知识。”因此,他肯定道,人工智能风控势必更优于大数据风控,“此外,人工智能的研究范畴不仅限于此类,还有小数据深度学习、认知智能、通用人工智能等。”
最后,邓教授表示,目前人工智能的革命性进展源于深度学习或因与深度学习的结合。人工智能的金融产品开发与产业发展正处于爆发期。仅需利用人类视听觉功能和简单决策能力的规范性或工具性的金融职业与岗位,有可能被人工智能所逐步取代。从“互联网+”到“人工智能+”,ABC大数据智能革命将会深刻地改变我们这个时代。
雷锋网版权文章,未经授权禁止转载。详情见。