周伯文、林清咏、山世光、郑宇、苏中、颜水成同台激辩:AI+金融的现场、难题和真实机会
雷锋网 (公众号:雷锋网) 按:今天,在首届“JDD-2017京东金融全球数据探索者大会”上午压轴,京东集团副总裁、AI平台及研究部负责人周伯文和哥伦比亚大学客座教授,Graphen CEO林清咏、中科视托董事长山世光、微软亚洲研究院城市计算领域负责人郑宇、IBM中国研究院研究总监苏中、360人工智能研究院院长颜水成进行了《探寻数据产业与AI发展之道》的精彩圆桌论坛,雷锋网编辑如下。
(雷锋网注:从左至右依次是……)
(周伯文:)首先,我们想来一个比较open的开放讨论,大家知道人工智能在今年非常热,也有来自与理论上,技术上最前沿的发展,像深度学习和大数据的资源以史无前例的速度进入了很多的行业。我想在座的都是研究人工智能的学术界和企业界的杰出人士。所以我想回到学术和技术本身,讨论一下从你们的角度来看
1. 三个开场问题
-
我们目前的人工智能的现状和不足是什么?
-
第二点是接下来的五到十年在技术上最优可能的突破在什么地方?
-
第三点是把问题回到金融行业来,有这些预期的发展和突破,在未来五到十年包括现在的现状,金融方面我们人工智能巨大的机会是什么?
这三个问题可以在您的发言中选择性的回答也可以回答所有的。从我右边的年轻的教授开始,他也是我以前的老同事。
林清咏: 谢谢伯文,我在哥伦比亚大学已经教了13年书了,我后来开始聚焦金融方面,过去两年前一直和全球的大佬们讨论AI和金融的关系,去年十月份的我去欧洲的一家银行,然后又给美国中央银行的年会,谈AI在金融方面的应用。IBM和全世界各大银行的CEO和总裁都去讨论什么是他们最痛的地方,常常讨论完了以后回来丢给我们的团队做,所以过去两年间累积了很多的经验。 实际上在美国,或者是说全世界,大家都在将AI与金融结合 。尤其是在华尔街的话,其实各个公司彼此都在竞争。军备竞赛就是在AI方面的竞赛。所以其实这就是现在的趋势,等一下我们可以再聊怎么做。我们在银行实践,一个礼拜到两个礼拜就可以取代以前人做的事情,接下来两个月时间把AI带进去以后可以做到他们以前没有办法想象,没有办法做到的东西,所以说在这个领域非常的活跃,所以我们决定自己出来,把这个机会扩张,也尽量的回到国内跟大家一起互动,跟国内的银行界和金融界有更多的关联。
周伯文:谢谢林清咏教授,下面山世光研究员有什么看法?
山世光: 非常高兴今天有机会跟各位讨论一下关于AI在金融领域的应用,刚才周总的问题,我想我重点的谈一下自己对于AI这个领域的现状以及存在的问题。因为我自己背景是做图像识别领域的,有大概20年的时间,可能最激动人心的时间真的是发生在了过去的两三年时间里。在这两三年时间里,得益于深度学习和我们能够拥有的大数据量,以及大规模的高性能计算的获得,使得我们在技术上有了非常大的进步。具体来说,一个简单的例子是我们在金融风控里面非常大量的采用人脸识别的技术,人脸识别技术在过去的三四年时间里,可以说在某些特定的场景下,它的准确率,或者是说我们反过来来讲它的错误率,其实有了我认为两到三个数量级的下降。也就是说我们过去可能会存在, 像四年前五年前的时候我们的错误率会在1%这个量级。那么现在很多的运营商都是万分之一,甚至十万分之一这样的错误率的量级 ,可见,深度学习,大数据和高性能的计算给我们带来了一个巨大的进步。 当然,这是一个例子,这是正面的例子。
反过来讲的话,以目前这样一个大数据加上深度学习这样一个技术的组合使得我们有这样一个大进步,很多其他的领域还没有像我们想象的,或者是说公众所期待的,所盼望的大进步,特别是在一些数据量不是那么容易获得的场景下,AI的技术是比较小的,我们对比人做AI的智慧和智能的时候,我们很多时候不需要人做大量的数据,也可以非常快速的获得以图象识别为例去做固体的识别,一个简单的例子,小孩儿扔苹果,从来不会有哪一个家长给小孩儿一千个苹果扔,可能几个例子就好了。从这里来说的话,我们AI从方法论的角度来讲的话,我们还需要大量的利用,也许是利用我们数千年来积累下来的知识,再配合某种意义的小数据,知识加上小数据和推理等方法才有可能会有更大的进步。尤其是涉及到因果推理,即便是数据量非常大,从一个结果推导出什么原因产生这样一个结果,应该说现在的这种因果推理方面没有非常大的进步。我想我们可以一会儿做更多的讨论,我先介绍这些,谢谢。
周伯文:是的,小样本学习和机器学习人工智能可检示性是接下来的热点和难题,我们看到了很好的进程,下面请你分享一下你的想法。
郑宇: 我叫郑宇,来自于微软研究院,负责城市计算各领域的研发工作,通俗来讲微软做城市相关的技术,由我们组来负责,用大数据解决城市里面的交通、环境、规划、商业问题,最主要的例子是全世界三百多个城市的空气质量的分析和预测是我们组来完成的。我分享三个观点。
第一个是AI的机会其实不在传统的IT行业,而是在和传统行业的结合 ,也就是说我们把AI和什么加在一起,加上交通、规划、金融等爆发的力量比传统互联网行业里面发挥的作用会更加的庞大,所以第一个观点,AI在传统行业里面加什么,拥抱传统行业和传统行业的知识结合。 第二点是如果AI和金融结合的话,我们一定从一手高价值数据里面发现商业机会,很多年前大家做这个人工智能和大数据应用金融行业都会分析股票和期货,可是 股票和期货的数据已经是三手数据,是别人经过多年沉淀以后的结果,真正的一手数据是我们现实生活中的周边也好,手机信号也好,记录也好,如何把一手信息进行有效的融合,这是在商业里面通过的一个制高点 ,而这里面需要大数据的融合技术,其实这个技术比较欠缺。 第三点,真正AI遇到的瓶颈在哪里,我们觉得技术本身不是大问题,我们这帮科学家,未来这么多人传承接待总会做出来, 但是人才的培养是一大困难 。现在数据分析师不太难找,什么是数据分析师呢,他会用一些工具,你给他明确的数据和问题,他给你算一些结果出来,告诉你这个报表。但是真正的数据科学家能够把传统问题和人工智能算法对接,最后落地形成闭环的人其实非常少。我们做了很多年,感觉培养这样的学生非常困难,这种学生不是读五年书就会学会的,还需要各种实战和个人的感悟。根据我个人经验判断,培养这样一个真正意义的数据科学家可能需要七到十年,未来可以想想怎么样在人才培养的机制上做突破,如果没有这么多人才,说得再多,最后也很难真正落地,所以我就是这三个观点。
周伯文:非常好,您的主要观点又懂AI,又懂具体业务场景的交叉结合是一个有很大需求的领域。所以跟在座的年轻的职业选择提供很好的建议。
郑宇: 鼓励大家成为数据科学家。
周伯文:当AI技术越来越强的时候对AI场景的定制化依赖是不是会减少,这个门槛随着AI技术的提高对应用场景的降低,这个你怎么看。
郑宇: 这是一个非常好的观点,为什么难就难在这里,我们懂数据科学的人对行业未必了解,对行业了解的时候,切入到另外一个场景又有很多新问题,需要快速的学习能力和提炼的能力,和需要已有的金融行业里面别人做的,做了什么工作,为什么好,为什么不好,如果东西只是比别人的结果好,别人不见得买你的账,知道别的结果和方法以后,用别人的语言去和别人沟通,这个东西是相互促进的过程,我们要拥抱传统行业,传统行业也要接近我们的科学,最后达到一个契合点。
我们对我们自己的要求一定要提高,再提高。虽然我们是做研究的,但是要努力跨出去和企业合作,去拥抱传统行业,AI不是去替换任何一个传统行业,一定要拥抱一个传统行业,AI可以帮助我们降低对传统行业的知识和门槛,但是不代表说你不需要传统行业的金融知识。所以这是双方的一个结合。
周伯文:谢谢。下面我们有请苏中讲讲您的想法。
苏中: 很高兴见到伯文和林清咏,都是我以前的同事,今天的话题是AI,周伯文给了三个话题,一个是AI的现状,刚刚讲得特别好,AI在这一轮里迎来了很好的机会,我们在大数据的基础说有了很多的在数据上的训练的算法,在图像和语音和自然语言方面有很大的突破,我们从这个角度来讲,是在吸收大数据的红利,因为现在的计算的资源,尤其是存储和网络成本越来越低,我相信这个上面仍然有很大的空间要去提高。
第二点就是说现在来看大数据,或者是说AI上面的挑战,我想刚刚虽然高老师说自然语言的理解或者是说人机交互已经是AI做得很好的一个方向了,我相信这个方向仍然有很大的余地或者是很远的路要走,原因是说在很多的时候,我们希望这个机器有智能的。现在大数据的智能,就像刚刚我们举的例子,给他一百万个苹果,让他识别,给他很多的东西。但是最终的结果是说它需要和人做自由的交互。那么语言,包括人的语言和书面的和各种各样的交流,其实是非常非常复杂的。这个里面,如果我们做得更好,我相信这是可能真正的一种强硬它的方式,就是说这个机器可以更好的理解人,可以跟人交互,从人的交互中,不光可以带来价值,同时也给我们心理上各方面带来很多的好处。我想这个方面应该有很长的路要走。
最后从技术角度来讲的话,因为我也是做自然语言理解的,我觉得在这个方向上,我们其实有很多的机会可走, 一个很重要的点是如何把结构化的知识和非结构化的内容能够结合起来,比如说我们看法律行业的工作,机器人算法能够更好的读懂论文和合同,以及法律文档 。事实上你会发现行业里面已经定义了很好的数据描述,我们能够看到很好的数据之间参考,我们如何把现实中海量数据,以及包括人在上面的行为数据和知识体系能够结合起来,让互相之间能够促进,让结构化和非结构化的知识能够进行一个很好的结合。
周伯文:非常好,您提到一个观点我非常赞同,可能也是我本人的研究背景决定的,您提到自然语言的理解对人工智能的交互很重要,因为我也是这么理解的,我们人类作为一个物种,人类的智慧和人类语言的能力基本上同步进化的。我想人工智能要发展到一个更好的阶段,对人类语言的深刻理解是一个不可逾越的门槛,也是下一个很有希望突破的领域。谢谢。我们下面有请颜总发表您的看法。
颜水成: 好的,谢谢周伯文,我叫颜水成,其实我原来在学术界做了七八年,一个偶然的机会去国内的一家电子的商务平台公司帮助他们孵化了一个产品,就是你拍照,然后可以到平台上搜索你的衣服。这个公司很有意思,做这个产品的时候,有一个非常庞大的团队,很快做出来了。后来意识到在学校里面做AI的话,在工业界里面有它非常强的,非常好的产品,恰好360有一个机会,希望组建人工智能的一个研究院,后来加入了奇虎360,后来就正式变成了工业界的人士。
对于人工智能的话,在过去这些年的发展,AI太大了,我觉得可能缩小一点来说——深度学习。深度学习在很多的公司来说是它当前的主要的驱动力,那么从这个深度学习的事情来说的话,我觉得当前的一种形式是说如果是在单模态的一个垂直场景的话,我觉得通过与工程师一起合力的话,落地和成功变得越来越清晰,如果我们跨过这个数据,要想在一个更通用的场景,现在的屏障是非常大的。
在将来的五到十年里,我觉得从深度学习的角度来说,在理论层面的话,就像今天高院士提到了一个行为主义,就是说我们可能需要像深度学习里面的,其实还是深度学习,但是把行为主义的思想用进来的话,这个模型的结构应该是在你的学习过程中是动态的更新,最后的话,会根据你的应用需要而智能的训练出它的形态,也就是说深度学习会从传统的特征学习和分类器学习,变成结构学习和特征学习,分类器学习合在一起来做,这是一方面,另外一个方面可能会有更好的优化的算法会迭出,让我们学术界或者是工业界可以在更短的时间内获得你希望得到的结果。我最近有一些反思,应用层面在技术角度来说是图像、语音、语意和大数据,大数据区分前面几个场景的特点是我们认为数据是表现出几个向量,有几句话的信息,不像语意和语音,我认为未来几年语义领域和语音的领域会越来越成熟,原因是几个方面,一个方面是市场上图像人才的量比较充分的,而且高校里面只看教授的话,有非常多的图像的团队,但是另外一个方面的话,其实还有两点,大家思考的不是特别多的,一个是说其实图像和大数据有一点不一样的地方是,当然都在用一些共性的数据,其实大家的数据差不多一样,没有自己独特的数据。这样的话比如说国家层面说要建立一个庞大的图像的库,即我要建立起一个庞大的语音库,这个库可以支持所有的图像和语音的公司。这是一个方面,从这个层面来说的话,可能经过一段时间之后,在图像和语音领域的话,这些公司就比较难以建立这个数据的壁垒,没有私有数据,其实大家都是一些共性或者是少量的个性化的数据。
另外一个方面是说其实图像和语音的应用也有它的特点就是---它没有应用的差异性,什么意思?你做一个模型之后的话,如果这个公司像沙老师的公司做得特别好,可能会支持中国的半壁江山都是可以的,没有问题。就是说从这个角度来说,图像和语音的话,可能在五到十年之后,会变得无论是人才还是应用级的话,会越来越成熟,甚至是在手机上变成平台级的厂商就可以做了,比如说苹果会把它自己的图像和自己的能力嵌入到他的手机里面,比如说像中国的华为和小米也很可能自己会有这种能力在里面。
那么,大数据领域会是在后面的五到十年可以越来越hot,可以越来越吸引人才。也可以从两个维度来分析,一个方面是说大数据的方向的话,其实有它天然的数据壁垒,金融积累了很多的数据, 360也有一些私有数据是大数据方面的,不会分享给私有公司,这样的话没有办法建立起数据集, 每家公司有独特的大数据,比较容易建立起大数据的壁垒 。另外同样拥有私有数据,像用户行为的数据,就比较容易产生一种效果,就是说公司会有这个应用的差异性,如同样是做金融,京东的用户行为数据是不一样的,你需要有你的人来做这件事,你的模型拿到另外一家公司不是马上就可以用的。 这个层面来说人工智能经过五到十年的发展之后的话,图像和语音领域会越来越成熟,人才也会越来越完备。但是具体的大数据的领域的话,对于人才的需求和行业的发展潜力,我觉得会越来越大 。会涌现越来越多的公司。我就分享这些。
周伯文:谢谢大家,大家都是行业内的专家,所以对于这个话题我知道你们都非常的有感触,如果我不限制时间你们可以一直讲下去,我觉得听得很过瘾,但是还觉得不够过瘾,为什么?因为你们还没有讲到具体的跟金融结合方面的想法。所以我来推动一下。
2. 关于人工智能+金融的结合
我们都知道金融行业里面风险控制可以说是一个永恒的话题。可以讲整个金融是风险控制的一个主题。从人工智能,大数据的角度来讲,过去的几年中,包括我们京东金融在内做了很多的非常好的,关于这个贷前风险预估的模型的工作,用大数据和人工智能可以不用跟人见面就能很好的评估这些风险。
今天换一个方向,我们贷后的风险,用人工智能和大数据能够做一些什么样的工作 。比如说我们贷款贷出去给某一个客户了,我们发现他失联了,找不到了。这种情况下目前人工智能和大数据能给我们带来什么样的启发和思路,也请大家对这个具体问题发表一下意见。有没有哪一位嘉宾自告奋勇,可以从林教授开始,我知道你在这个方面研究很多。
林清咏: 金融界里面的贷款问题,尤其是贷后,这是一个蛮大的事情 ,去年单单是第一季度的工商银行的不良贷款,就达到了2000亿个人民币,这是一个季度很大的亏损,虽然是全世界第一大行,但是也没有办法经得起这样的亏损,所以贷后的问题,如何去预测一个企业会不会出状况,这是全世界银行都关心的问题,因为银行之所以赚钱就是因为贷款,他们要赌,要知道风险,这是一个相当严重的问题。
那么,我们去年实际上就是我的团队从纽约到北京和上海,针对国内的数据来做这样的预测。基本上我们就发现以我们AI的能力,或者是说以前我的团队是美国政府资助我们几个亿的资金建立一个像脑这样的系统,包括不仅是深度学习,还有理解和刚刚托马斯·桑德霍姆讲的训练能力等。我们根据这样的整个全部脑的功能的系统,把它带过来, 带过来的话基本上可以把这个贷后的不良贷款预测,可以把原来不到20%的准确率提升到大概接近60% 。我们可以看到AI还有很多的问题是金融界关心的。比如说证券业,还有国家最关心的洗钱问题,因为洗钱关注到国家安全,以及他们知道怎么样躲监管等等。
另外就是说在大概两年前,像摩根、大通银行最关心的问题是交易员操作的问题,你怎么样去测,怎么样去抓里面交易员在想办法放假消息或者是想办法操作别人,希望在操作市场中牟利。 然后我的团队两年前就帮助IBM开发了这个金融方面的AI产品,想办法监测交易员如何监测市场,看他们做什么行为。实际上这也是一个大数据的问题,这个大数据就是说如何在这么多的行为里面从他们的交易行为和通讯,因为交易员本身就有一些网络之间的消息,可以看到他们散步消息讲一些什么,你可以大概知道这些事。所以实际上有相当大的空间在做。
我也知道鼓励,就是说事实上在金融界有两类人,有一类人是你跟银行方面的问题,另外是跟证券和股票市场方面的问题。事实上,我们发现说第二类的问题的话,其实进度障碍比较小,因为我以前在研究的时候,跟各行各业的做AI,跟各行各业做AI的最大痛苦是他们愿意不愿意把银行(方面的资料)给你,愿意不愿意讨论他们的难点。所以,那个过程上都要花好几年的时间,并不一定能够得到双方都愿意这样做。但是如果去做,把AI应用在这个股票市场的话,实际上因为大家的竞争也是公平的,所以其实这个进度障碍稍微少一点,不用去依赖已经成熟的大企业,其实这是一个蛮好的方向。
其实就是说,有一点我想鼓励大家的是基本上我们讨论AI的话,有一点我观察到了,是不是有开创性的东西,大家有尝试去做,我看到很多大家去做AI就是跟着后面走。就是说他有什么东西,你就拿来用,然后有多少人是耐着性子想办法把AI再往前进,从最底层起,那么我觉得如果你真的要解一些很难的问题,你要开始去看看人家还没有去看过的,这样的话你才能有突破,这个方面非常紧缺。另外AI方面的人才也是很多,如果你真的能够做到这样的话,就必须差不多在我的团队,如果没有七到十年的经验怎么去解析这个问题的话,很多时候根本做不到,这真的是全世界在这个方面的人才缺得蛮凶的。我们哥伦比亚大学其实很努力的培养这样的人才,但是就是说就很不积极这样的。所以其实是鼓励往这个方面去做。真的是机会相当多,然后在中国做的经验向全世界拓展,其实是一个蛮好的机会。
周伯文:谢谢,我相信山世光你在视频方面的积累有很多的想法,你可以不仅仅谈视频,可以帮我们怎么样评估贷后的风险,如何找到失踪的人,你有什么好想法和建议。
山世光:我确认一下是投后的管控,特别是有一些失联的情况,是吧?我觉得两个方面,当然这个贷前的风控也许更重要,确实对于贷后的失联,我觉得这个会有两个方面,一个方面是说我们的政策以及我们国家政策和法律,以及我们的诚信体系的建立,我相信会使得这个世界失联的人越来越少,因为失联以后带来的成本会很巨大。另外技术上有了越来越多的可能性把所谓失联的人通过人肉搜索也好,什么也好,找出来,现在我们人类生活在这个社会上你只要上网,出现在公共场所,和朋友联系等等都会留下痕迹,都会有各种各样的线索会被留下来。
所以以具体的人脸识别为例,除了在金融领域里面有非常成功的应用之外,像人脸识别这样的一些技术,在公共安全的领域去实现一个公共场所的人员搜索的技术现在也逐步走上成熟,离我们最终期望的每一个坏人在公共场所里面出现就能够抓住的话有很远的距离。但是随着我们国家在各种场所安装的摄像机的密度和他的精度的不断提高,再加上技术的进步的话,无论是在网吧还是公共场所,甚至是说在一些只要能够有这种摄像的环境下出现的时候,都有非常大的概率会被这样的系统找到,当然了,我不知道金融系统是不是说也许假设5%的坏账,5%的失联人,是不是都值得报案由公安系统来做这件事,未必。但是确实会有很多的漏掉的,因为我们国家除了在逃人员之外,其实还有很多其它的黑名单,有很多的场合是可以去监控的,我想我主要是从这个角度来说,你失联的成本会特别高,所以的话,未来我相信很快会,大部分的人会意识到这样一点,然后很快会回归到正常的金融秩序上来。
郑宇:我们和金融公司沟通之后我觉得他们做的很远,后来发现金融公司里面,特别是京东金融这样的公司里面,大部分数据是时空数据,也就是说用户有消费数据的时候他们有一个位置,什么地方消费,什么时间,这种时空数据的分析和挖掘方法和传统的AI有区别。刚刚两个问题,怎么放贷前做风险评估和失联之后怎么样做,这是我们研究的问题,我们经常做银行贷款的时候,会拿一个抵押,比如说房子抵押,举一个例子王健林说万达广场抵押给你,贷五十个亿,银行说值不值呢,现在考虑当前的楼面价格和周边价格用一个均价做估算,贷款中房屋的价值在未来一年两年是不是有增值或者是贬值,如果泡沫很大就少贷一点,如果是增值的,可以多贷一点,这是我们的真实案例里面,我们结合周边的地铁、公交、人们出行数据和地铁、公交卡、刷卡记录等等综合判断整个城市里面各个小区价值的排序。我不是说我预测具体的价格,但是如果涨的话,谁涨得更多,如果跌的话谁跌得更少,我们第一步把整个北京小区的房屋价值排序,谁是一类,谁是五类,都有排序,对明年的涨幅有判断,另外综合体现像万达广场和soho这种非常复杂的,有写字楼,商铺,电影院在一块儿的价值评估也做了一个判断,给银行提供基本面的参考,做贷款的时候,看看资产评估本身做多少钱,再决定放多少钱,多少年,这是第一步。下一个地方具体在什么地方,这里会有不一样的,之前填资料的时候会有信用卡卡号或者是银行帐号,手机号提供,但是失联以后绝对不会再用这个账号,用手机之后,之前拿出来,基于时空大数据的分析方法,可以判断他家在什么地方,常去的几个地方是什么地方,虽然换了手机号,但是生活习惯还是符合之前的规律,可以判断对之前常去的什么地方可以找到,另外手机拿不到的话,可以通过社交网络和微博和微信,他朋友的数据, 比如说他的位置可能是空的,他会做好所有的准备把他微博里面的地址信息灭掉,但是没有关系,根据他朋友的位置可以推断出他的位置以及他未来可能去哪里 ,这是很简单的道理,你知道你周边的朋友在哪里,你们经常往来,位置在什么地方有相关的分布,可以在模型算法中可以得到。
其实我们做的工作和金融蛮紧密,就是大数据在时空数据领域里面如何用人工智能和大数据的方法进行精准的判断。
苏中: 非常好,如果这个人已经失联了,其实已经很晚了,这是公安局的事情了,金融角度来说,他可能失联之前会有一个很好的预判,如果企业也好,个人也好,作为一个贷款人,贷后管理来讲,其实他都有一个他的一个信息,比如说收入,企业的收入,上下游行业和国家政策走向,以及相关的材料和原材料的价格等等的影响。所以这可能是一个非常复杂的大数据的工程,这个角度来讲的话,可能是一个不光是你判断这个客户的风险情况,还有一个角度是你要判断他的抵押品的情况。还有一个角度是同样的技术可以挖掘你的新客户,这个行业在刚刚很好的时候可以很好去做。
所以人工智能和大数据角度去讲的话判断一个贷后风险是一个从一开始,从客户开始,有一个沟通,贷多少钱,利率多少,到怎么管理。这里所有的数据,如果在上面应用更多, 在上面有更好的风险模型,不光是企业的风险模型,也包括关键的人物,法人和社交,以及家族等等的关系模式,其实你可以在做到很好的情况下还没有失联的时候,甚至是还在的时候,你可以提供一些建议 。刚刚我讲的,这里不仅包括结构化的数据,也包括非结构化的数据的分析,也包括人与人之间的数据分析,可以做一个很好的分析。
颜水成: 这个问题其实蛮有意思的,就是说我在金融领域做和人工智能相关的探索,应该还是一个初学者,其实也是从公司的业务,以及外边的创意公司的交流或者是说从中得到一些信息。其实有意思的是当前我认为在人工智能的征信方面的应用,大家还大部分的拼数据,其实在这个算法层面的话,我觉得还不算是特别的,也有可能是说外面比一些研究机构并没有办法拿到太多的这个方面的数据,进行深入的探索。但是对于大部分的公司来说,数据并不全面。如果可以实时拿到用户动态数据的话,对用户的管理是非常有价值的,另外是做投后管理的话,比如说丢失或者是说发生了后面的什么行为,意味着你要跟很多的数据源要打交道,在中国来说的话,不同的数据源之间像一个数据的孤岛,并没有形成一个联盟说我可以共享一些数据,比如说是P to P的,或者是说金融贷款相关的。如果我投了之后发现金融的公司里面借了钱,再跑到其他公司借了钱,这个方面的数据就有价值了,这个方面做得还不是非常的完善。数据的孤岛一旦打通了,和多种数据源的数据打通的话,投后管理的话就有很多的事情可以做了。
对于个人方面,人工智能产品和技术使用的话,还是比较少,我们会看到一些个人,比如炒股的时候他们写一些程序做事情,但是并没有一种平台或者是软件的话去帮助个人去做这些决策,比如说我怎么样根据自己的特点,智能的决定我应该去拿这些去做,或者是应该投资哪些方面,这个方面是缺失,也许这一块能够有机会做好的话,应该是一个非常不错的市场。
周伯文:非常好,这是一个非常具体的金融行业的问题,所以大家的讨论可以说是给很多的在座者提供一个人工智能这样一个具体落地的一个建议和思考,现在我把问题拉回来一点,还是聚焦在金融领域,不那么具体,从我作为人工智能的研究者角度来看,我们很多方面是人工智能聚焦到具体客观的问题,比如说语音识别和自然语意理解都是这么一个情况。 但是人工智能用在金融行业有一个比较突出的问题,因为金融市场是人的活动,有很多情况下有非理性的活动,市场过热的时候,个人投资或者是机构投资有很多非理性的行动,人工智能光从大数据的角度,每个人都在买进,所以我买进的欲望越来越强,把这种非理性还在往做的方向继续推动,你们关于人工智能,金融方面的考虑,有没有具体的想法和办法去处理这种非理性的人类金融行为 ,可能和我们一贯讲的大数据中的学习是一个根本不同的原则,这是第一点。
第二点,再回到风险控制,我们都知道强化学习在金融行业中很有用,比如说智能投顾等各方面,但是强化学习一个很重要的原则是探索和利用这样一个平衡。在AlphaGo里面这些强化的例子里面包括了德州扑克,这些都是很具体的应用,但是金融行业里面怎么样控制这个风险,有没有志愿者讨论一下这个问题。
林清咏: 刚刚提到了挺有趣的,如何帮助解决这个人类非理性在金融市场后面的问题,其实我们公司现在正在开发一个蛮大的系统,就是说我们让机器来做这件事,然后我们是等于每个人都有几个大师,可以雇佣它,AI机器人帮助你去做投资。它就变成了你所说的奴隶也好或者是说,就是代替你来做这些分析。
那么,慢慢的话,就变成了你在股票市场上不是你作为个人去判断,而是说你的机器人去跟别人去拼,为什么有这样的差距。我们发现一个最基本的差别是我们的个人机器人,帮助你做投资理财的机器人,他就是24个小时一直在学习。然后它每三到五秒钟要做一次判断,要不要买,要不要卖,人哪有办法做到这一点,哪有可能一天从早到晚不要睡觉盯着股票趋势去看,去想,然后你人的那个自我学习的能力,还没有办法做到那一点。
所以,实际上我们开发这个系统的过去几个月中的经验来讲的话,我们真的觉得说人类哪里是对手,以后比较的话也是机器人互相的比较。几年后你谈的不是人类非理性的行为,而是太多机器人彼此的理性行为去打仗的时候,你要怎么样在里面赢。所以或许一两年之后,这个问题的讨论的重点又会不大一样了。
周伯文:还有哪位嘉宾有思考。
郑宇: 其实每天都有很多人带着不同的项目找我,我想三个方面,一个是帮助行业营利,这是基本的,第二个帮助国家和人民的生活,第三个推动研究的进展,我举一个实例,有人找我能不能用你AI技术预测一下煤炭价格的涨幅,我不帮你预测,这个对你有利,对国家没有利,无非是你的钱和别人的钱交换一下,有人让我预测一下股票,我不做,有人通过技术来调整锅炉的发电效率,怎么样通过用更小的煤产生更多的电,并且降低更多的污染排放,这是电力行业的根本,既帮助了行业的营利,也帮助了国家和行业的进步,也使我们的研究往前推了一步,这是AlphaGo在其他行业里面能找到着力点的地方,我就讲这么多。
苏中:计算机把人的感性做起来,这是很难的,举一个例子,泰国危机的时候,很多的爱国者把黄金捐出来去维持国家的货币等很多的情况,这样的东西让计算机去模拟的话,计算机很难去理解。其实市场上我们讲市场经济有一看不见的手,其实可以看到有很多的看不见的手,这些很多看不见的手去建模,对于不同的人群,有不同的利益和宗教信仰和不同的生活方式,更是很难的方式,这个角度来讲的话也是一个很好的研究的话题,计算机比人理性得多,这种理性也会产生一个很大的问题,如果市场上所有的计算机交易的话,可能会发生股票突涨突高,也许就是因为人的理性或者是感性的成分扮演了市场中的一个阻力的过程,这种阻力可能像是山坡上滚下来的小雪球,也有可能变成一个很大的事情,也有可能停在某一个地方不动了,所以我想金融市场是非常有意思的市场,比德州扑克有意思的多,应该讲不是一个简单的技术或者是说一个简单的方法可以很好解决的。
三. 关于人工智能+零售行业
周伯文:好, 我们再回到别的行业 ,再把视野放大一点,人工智能改变了很多的行业,除了金融还有一个最典型的例子是我们京东的零售行业。我们认为AI没有办法改变零售的本质,但是可以改变它的形式。大家怎么看待这句话。更具体的说,大家如何看待无论是零售店在这种零售革命中扮演一个什么样的角色。在将来随着AI技术的发展和进步,无论零售和新的零售的将来是什么样子,请你们展开你们的想象力或者是说对技术理解,在这个方面发表一些意见。
苏中: 我觉得我们的技术发展到今天,很多的技术越发展,我们生活越糟糕,我们有了手机,无论如何都会半夜被人吵到,有了网络,什么地方都可以工作,你的沟通成本看似降低了,实际上花在上面的更多了。所以我想AI的技术能不能让我们的生活变得更好一点,也许我们的朋友圈从五百个,变成五十个,十个,我们的生活质量比现在更高,这可能是一个很好的发展方向。
郑宇: 我讲一下无人的零售店,我有朋友做这个方面的,我觉得第一个是打通的线上线下零售业的通道,以前做很多的电商的时候,用户在线上购买行为,很多的东西在线下卖的,我们并不知道,什么东西线下买呢,像短平快的东西,新鲜水果每天都要买,网上的图片很漂亮,但是买回来不一样,无人零售的店里面可以看到很新鲜的,就可以买回来,这是填补了以前的空白,对人类以前的建模和市场分析都是不完整的,只是在互联网的线上数据做了分析,线下什么样,这是很初级的,现在的无人零售店可以作为一个触角深入里面去,可以解决一个新物种的需求,短平快物流的需求。第二个其实是可以去感知很多人们行为的变化。可以快速的感知,你对这个线上的东西是很长的流程,慢慢的过程,线下的时候是实施了摄像头监控,马上知道什么时候缺,什么东西少,什么会走,什么会调货,这比线上的环节分析快很多,所以更快捷,更敏锐,就这两个方面。
颜水成: 现在关注比较多的是国内的商店,国内有几家公司在探索这个方向。我个人认为对这个方向是有比较明显的态度。有两个原因,一个原因是说这件事对运营方来说有价值,对客户来说的话并没有带来额外的刚需体验。第二个是一个重点,就是说我觉得从支付的维度的话其实是有很大的问题的,特别是在中国,因为你支付的方面,除非我们出现新的sensor在里面,你出去之后的话带来什么样的商品,现在我们抢着用计算机视觉的技术来实现这个目标的话,其实一定会存在着一个屏障,这个屏障是什么?比如说顾客拿了东西,因为计算机视觉是不完美,这一点我们必须要承认,我们达到99.9%可能就已经到了极限了,甚至可能达不到,这种带来两种情况,顾客拿来商品,我们系统上没有识别,这个其实无所谓,这个数据,比如说金融系统的风控的一部分。我们在商店卖东西没有人买,要坏掉,要扔掉是一样的。但是如果这个用户并没有拿这个商品让你识别成一个商品,这样的话意味着你在账户的钱多拿走了,这件事的话,其实对于客户来说,是非常不能接受的。他不像信用卡,刷了之后我可以找到你,什么原因我可以把款退回给你,这件事如果发生之后用户会比较难以接受,难以接受的话就意味着这个东西的推行,在一段时间一会碰到潜在的屏障,为了解决这个问题需要一种可能性,我需要别的sensor并不强力依赖于零售的人类的sensor这是另外一码事了,是不是和人工智能有关系我不知道了,这是我想表达的,无人商店往前走的话路程并不是那么平坦。
山世光: 如果我们看一个历史的发展的话,从过去的一个叫做无人售货机这样一个小的机器售货发展下来到商品更加的丰富,走到更多的地方去,我个人认为是有这个方面的需求的。比如说在晚上或者是说很多的,你说物流的话,再发展也不可能半夜,凌晨的时候给你送一点东西,大部分是非常困难的。类似这样的需求在社区里面,还是说会存在的。我觉得我个人还是蛮看好的,另外从技术的角度来讲的话,确实就像刚刚讲的,一定会存在着误差,有误识别的情况,无论是商品的识别还是对购买人的识别这两个方面,可能都会有一定误差。但是从我们解决这个问题的角度来讲的话,如何去容忍这个误差,以及这个误差会带来多少的损失。那么其实有一个我跟他们聊的时候,他们的一个观点是说我即便每个月损失多少钱,把钱折回去,比如说我原来开一个店,要雇五个人或者是几个人,但是他们的人力成本可能会完全的超过了你可能带来的损失。
另外一个有误识别的情况下,我们会倾向于不要让顾客多花钱,是吧?而是倾向于商家会宁可损失一点,但是顾客,特别是买完了以后,一看价钱不对会当时有反应的。这个上面我们形成一个完整的解决方案的话,是有可能解决这些问题的。
颜水成: 其实我是赞同山世光的说法,我可能刚刚讲的话稍微有一点点偏差。无人商店这件事有它的价值,比如说在美国有一些地方,你去超市购买东西,晚上去的话,拿了东西去扫一下就拿走了。并不一定要强调说我的人工智能把你拿的商品是什么东西,识别出来,然后出去之后就把账付了。我的意思是重点在后面,人工智能的技术,当前的水平,没有办法去杜绝你的商品识别错了之后的话,用户并没有买这个商品,但是把账记到上面了,这样的话对于客户来说反而是一件非常烦扰的一件事,我要经常去看看我的,到商店里面买的东西,我的账是不是对的,也许我们并不一定要强调说我的智能系统能识别出你拿了什么商品,通过扫码或者是其他的方式去完成这种支付。
苏中: 我还是觉得去有人的商店,有更多的客人或者是和店员交流,我觉得人与人之间的交流,哪怕和机器人交流也比我自己拿完东西扫脸出去要好,方便角度来说,是满足了某一个人方面的。我支持有人,但是这个人也可以是机器人。
周伯文:可能十个人,现在需要一个人也是带来了大大的成本的降低。
郑宇: 我的观点比较务实,未必把最新的刷脸放在上面,先刷码,关键是把实体店和线上的定位区别开,能不能做到短平快,物流的算法很重要,新鲜的货物进来,买东西和网上的速度差不多,东西不新鲜了,为什么过去买呢?定位不精准的话,这个就没有深度,定位很精准的话,用AI来保证物流而不是识别,识别不是重点,现在拿刷码,贴码,我觉得用户都可以用,而且很好用,没问题。
周伯文:大家的观点有不同的地方,我想有更多的是相同的地方,AI对零售的改变现在正在发生,将来有很多的空间可以去做,不光是线上,也有线下,线下对门店的改造,用各种各样的去改造,线上线下结合,这是一个非常有发展空间的领域,也是我们大力探索的方向。
四. 如何看待目前中美两国的AI现状+战略不同点
时间关系我不再继续了,我们把讨论上升到新的高度上,在座有政府人员参加我们这个活动,在座各位中也有中美两地的科学家,也有长期生活在美国的,我也是刚刚从美国回来一个月。我想问大家的是站在AI的战略高度角度来看的话,中美两国是领跑者,无论是战略的投资还是技术的发展,但是中美两国还有很大的不同。我想问问大家,你们怎么看待中美两国目前的AI现状战略的不同点。相互彼此学习什么东西。还有你大概预期这个目前这一拨,我们中国这拨人工智能大概,因为我们不同的战略,不同的发展方向,五年以后中美两国的AI现状会有什么样的不同。从这里开始讨论一下。
山世光: 我觉得现在我们中国在AI的应用方面,根据我的观察,我觉得是走在前列的,特别是我们各大企业,包括我们的国家在政策,在资金的支持和投资界,确实是从人力物力财力各方面做了大量的投入。有投入就一定会有产出。我们有这么大的市场,这显然是我们确实走在了应用的前列。但是,其实我在看到这个,你说到这个题目的时候,我确实有一点担心,这个担心体现在我们中美差异上,在AI的基础研究的层面上,我觉得国内其实相对来说要偏弱了一点,这种偏弱又可能因为我们刚才说的,从国家的,从企业到投资界各个方面的力量,社会力量大量投入到应用上去,有一定的关系,无论从人才的培养角度,其实我们也关注到了研究生的心态,其实是有变化的。 因为找工作太好找了,工资太高了,所以特别优秀的顶级聪明的研究生就选择了在本科毕业就出去了,或者是说硕士毕业就出去了,而没有去继续投入到AI的基础研究领域 。事实上,像今天早上,无论是高老师还是杨老师都介绍了AI这个领域,我们只是万里长征的才走几步,大量的问题没有解决,这个阶段如果我们有一点釜底抽薪的味道,把前面的基础研究过早砍断的话,对后面的长期发展未必有利。所以我自己本人在科研机构和工业化,有时候会反思这样一个情况。期望我们工业界还是要有一点克制,把我们的一部分的优秀人才,还是应该鼓励他们留在基础研究这样一个行业里面。使得我们不会后继乏力,等到后面又冒出一个,不是深度学习,而是其他的方法论,来解决更多的问题的时候,我们又没有跟上,这是值得我们反思和注意的地方。
郑宇:因为我们这么多年来一直和政府合作,互相大数据和智慧学会和环保部,我自己在学校里面兼职做教授,现在的学生越来越贵,一个月开八千块钱,做的好的学生是上万的工资,这么多年感受下来,到底怎么做?政府、传统行业的公司和IT公司和学校如何分担自己的责任,做到四位一体?政府就是出政策,鼓励开放数据和合作,政府提不出问题, 大家不要怪政府,政府不是行业专家,更不是数据科学专家,政府提一个问题,提需求,不现实,需求是传统行业公司,传统的交通公司和金融公司,传统的电力公司提出需求 。他们提供专业的知识和技能,我们IT互联网公司提供大数据,平台,基础设施保障,然后学校跟企业联合培养人才,就刚刚山世光说的这一点,你学校单纯靠自己的实力留学生是留不住的,而且学校里面不具备这种条件,没有大数据的平台和数据培养不起来,几个案例培养学生也没有什么用,最后是企业和学校联合培训,最后就是这种方法,我们自己成立企业,成立公司,各个部门不要越权干自己不该干的事情,虽然我们已经有高校了, 政府搞研究的话本身不是最优的,政府出政策,传统行业提需求,提问题,学校和企业联合培养人才才有希望 。
颜水成:这件事我也比较乐观的,比较积极的看法,美国在理论层面比中国强,这是不争的事实,中国慢慢在应用层面已经赶上或者是超过美国的话也是一个事实,就是说有一个很好的事情,其实说AI的理论的话,是不是研究透了,它可以对这个产业产生价值这件事是一个不争的事实,我们并不需要把理论研究得那么透的话,也会对社会的方方面面产生积极的影响。
另外一个方面,其实人工智能做法的话,我觉得非常像医药,美国的话更像是西医,中国更像是中医。并不需要去了解说我里面的所有的理论,以及真实的成分是什么东西,我通过试验,通过验证,它有效果,而且是有价值的。那么美国的可能会更多的希望像西医一样去做这个人工智能,把它内在的机理研究得更加的透彻,这样的话希望它的长远价值会更多。
我们看到的事实是几千年历史里面西医和中医的价值,都是非常重要的,所以说从这个层面的话我们觉得说也不要太多的担心中国人工智能的理论的话,可能人力资源的积累并不是特别多。但是它可以给中国的经济带来积极的价值,这件事一定是在那的。另外是我们也看到了有更多的在这个理论层面做得比较好的教授,从国外归来,在中国的不同的学校里面或者是研究所里面最研究。
五. 如何看待AI科学家和AI企业责任两者之间的平衡和冲突
周伯文:我们最后一点时间谈谈情怀。问你们一个比较个人的问题,你们在座的都是AI科学家,在学校里面还有兼职或者是从教的经历,同时又在企业里面或者是说学校里面有兼职,做一些AI的商业应用,从你们的个人角度来看,怎么看待AI科学家和AI企业责任这两种之间的平衡和冲突,比如说你更关心的是算法的进步还是某一个具体的算法的落地的商业价值,有冲突的时候,你们是怎么样思考的。
林清咏: 我在学校也很久了,十几年,在企业界二十年了,基本上来说这都非常重要,基本研究很重要,应用很重要,我的策略就是说想办法把我的团队养大,一部分人专门负责基础往前提升,另外一部分人专门负责解决当前还没有解决的问题。比如说现在我们的基础团队利用金融市场和做金融行业来把AI的能力往前进,把人和AI往前推进,利用这样的AI系统,也帮助我们最近和美国排名第一的做癌症的研究中心,把我们的系统带进去,他们就请我们去帮助他们解决,如何分析过去二十年来几百万的病例。那就是说让这样的AI系统同时可以替人类解决癌症可能带来的一线曙光,或者是说我们最近学生在开展用这个做老年痴呆症的研究等等。所以是有可能找到解决方案的。
山世光: 我简单说一下,我觉得还是比较好平衡的,对我们来说做的,至少在AI这个领域做的大部分,无论是技术还是产品的话,更重要的是它可以推动这个社会的进步的,关键看谁在用了,从我们做技术的角度来讲的话,我觉得一句话非常重要,就是说价值会决定价格。无论是说你去做产品,还是说你去做一个从科学,研究的角度来讲的话,都是要有存在的价值,或者是满足科学进步的需求,或者是说满足用户的需求,都值得我们去做的。
郑宇: 我说一下未来的目标吧,之所以没有出来创业,很多同学说,老师你怎么不出去创业,外面环境那么好,有很多人工资给你加一个0你来不来,给你1%的股份,你来不来,我对创意的定义并不一定是自己开公司,你能够开创一个事业自己乐在其中并且帮助行业和国家往前推进这就是一份事业,并且持续做下去,未来的目标我觉得有两个方面,一个是希望把城市计算的领域在全球做大并且中国在里面领先世界,第二个是和同学同行老师们一起把这个技术做到世界之巅,和这个吻合就去做,不吻合就不做。
苏中: 做了几十年的技术,心理是希望多做底层的技术,把技术做专做穿,但是真正说,因为现在我在IBM的研究院,希望技术应用在实际的场合中,所以另外一个方面的力量拉动我去做技术产生价值,这两者之间有的时候是矛盾的,有的时候是契合的。所以在这个矛盾和契合中是一个螺旋上升的过程,所以也很幸运,AI有一个很好的年代,所以我想我们做技术的人有一个很好的机会。
颜水成: 我觉得学校出来的教授的话,会有一个毛病,产品里面技术是一个很重要的,另外通过自己的几年实践和我的导师在工程原理写了一本书里面提到了,这件事一定要刻苦,其实你的技术在一个产品里面成功的话,最多能占30%-40%。最好的办法是把你的技术嫁接在一个好的产品上,要相信除了你之外还有其他的维度,这个产品的成功也是非常关键的,就是说不要把自己在这个产品里面做得太重,大家一起作,一起共赢就可以了。
周伯文:非常好,再次感谢各位嘉宾的分享。我把时间交给主持人。
。