浮沉发展 60 年,人工智能这波热潮还能走多远?
一、AI 的现状和不足
山世光(中科院智能信息处理重点实验室常务副主任、中科视拓董事长兼CTO)
我在图像识别领域已经做了大概有20年,最激动人心的时刻可能就是在过去的两三年。因为在这两三年时间里,得益于深度学习和我们拥有的庞大数据量,以及大规模的高性能计算,我们在技术上有了非常大的进步。举个简单的例子,我们在金融风控里大量采用人脸识别技术,它的错误率在近几年有了两到三个数量级的下降。也就是说,四五年前错误率可能会在 1% 这个量级,那现在很多运营商都只有万分之一,甚至十万分之一这样的错误率量级。可见,深度学习、大数据和高性能的计算给我们带来了怎样的进步。
以上是一个正面的例子。反过来讲,以目前大数据加深度学习这样一个技术组合,在很多其他领域还没达到我们想象的,或者是说公众所期待的大进步,特别是在一些数据量不是那么容易获得的场景下,AI 技术带来的作用是比较小的。就拿人和 AI 对比来说,我们很多时候不需要人做大量的数据,就可以非常快速的获得以图象识别为例去做固体的识别的能力。比如说小孩认苹果,不会有哪一个家长给小孩一千个苹果去认,可能只要给几个例子就好。从这个方法论的角度来看,我们还需要大量的利用数千年来积累下来的知识,再配合某种意义的小数据,形成一种知识+小数据+推理相关的方法,才有可能带来更大的进步。尤其是当涉及到因果推理时,即使数据量非常大,要从一个结果推导出什么原因产生这样的结果,仍然很难。
郑宇(微软亚洲研究院城市计算领域负责人 、美国计算机学会杰出科学家)
AI 的机会其实不在传统的 IT 行业,而是在和传统行业的结合,也就是我们说的 AI + ,AI 加交通、规划、金融等爆发的力量会比在传统互联网行业里发挥的作用更大。
至于 AI 遇到的瓶颈,我觉得技术本身不是大问题。这么多人传承下去,技术问题总会解决的,但人才的培养是一大难题。当前数据分析师不难找,但真正能够把传统问题和人工智能算法对接,最后落地形成闭环的数据科学家其实非常少。我们做了很多年,感觉培养这样的学生非常困难。这不是读五年书就会学会的,还需要各种实战和个人的感悟。据我个人经验判断,培养这样一个真正意义上的数据科学家可能需要 7-10 年。所以,未来可以想想怎么样在人才培养的机制上做突破。如果人才缺失,说得再多,最终也难真正落地。
苏中(IBM中国研究院研究总监)
AI 在这一轮里迎来了很好的机会,我们在大数据的基础上有了很多的在数据上的训练的算法,在图像和语音和自然语言方面有很大的突破。从这个角度来讲,AI 是在吸收大数据的红利。因为现在的计算资源,尤其是存储和网络成本越来越低,我相信这方面仍然有很大的空间要去提高。
至于 AI 面对的挑战,我认为在对自然语言的理解或者是说人机交互方面, AI 仍然有很远的路要走。多数情况下,我们肯定是希望这个机器是有智能的,是吧?现在大数据的智能,就像前面举到的例子,给他一百万个苹果让它识别,或者给它很多其它的东西,反正最终的结果就是需要它和人做自由的交互。那么问题来了,不管是人说话的语言,还是书面上或其他方式的各种各样的交流,都是非常非常复杂的。如果我们能把这个问题处理得更好,机器可以更好的理解人,我认为这才是 AI 真正强大的方式。
颜水成(360集团副总裁、首席科学家、人工智能研究院院长)
谈 AI 有点太泛了,我缩小一点来说深度学习。深度学习在很多公司来说是它当前的主要驱动力,如果是在单模态的一个垂直场景下,我觉得通过与工程师一起合力,落地和成功会变得越来越清晰。但如果我们跨过这个数据,要想在一个更通用的场景,现在的屏障是非常大的。
在未来的 5-10 年里,我觉得从理论层面来说,深度学习会从传统的特征学习和分类器学习,变成结构学习、特征学习、分类器学习相互结合的形式。另一方面,可能会有更好的优化算法出现,让学术界或者是工业界可以在更短的时间内获得希望得到的结果。
另外,我认为未来几年语意领域和语音领域会越来越成熟,原因有几个方面:一是市场上图像人才的量比较充分,而且高校里面有比较多的攻读图像的团队;二是大家都在用一些共性的图像数据,没有自己独特的数据,当建起一个庞大的语音库时,它可能能支持所有的图像和语音的公司,难以建立数据的壁垒;三是图像和语音的应用其实没有普通应用的差异性,做一个成熟的模型出来后,可能能够支持中国的半壁江山。
二、AI + 金融和 AI + 零售的前景
周伯文:
从作为人工智能的研究者角度来看,人工智能用在金融行业有一个比较突出的问题,因为金融市场是人的活动,有很多情况下有非理性的活动。市场过热的时候,个人投资或者是机构投资有很多非理性的行动,人工智能如果单单从大数据的角度,会发现每个人都在买进,导致也往这种非理性的行为继续推动。所以,有没有具体的想法和办法去处理这种非理性的人类金融行为,可能和我们一贯讲的大数据中的学习是一个完全不同的原则,这是第一点。
第二点,关于类似于失联这样的风险控制。我们都知道强化学习在金融行业中很有用,比如说智能投顾等各方面。但是强化学习一个很重要的原则是探索和利用这样一个平衡。在 AlphaGo 里面这些强化的例子里面包括了德州扑克,这些都是很具体的应用。在金融行业里面要怎么样控制这个风险,还有待探讨。
颜水成:
在金融领域做和人工智能相关的探索,我应该还是一个初学者。主要是从公司的业务,以及外边的创意公司的交流中得到的一些信息。有意思的是当前我认为在人工智能的征信方面的应用,大家还主要在拼数据。其实在这个算法层面,对于大部分的公司来说,数据并不全面。如果可以实时拿到用户动态数据,对用户的管理是非常有价值的。另外,如果是做投后管理的话,意味着你要跟很多的数据源要打交道。在中国来说,不同的数据源之间像一座孤岛,并没有形成一个联盟来共享一些数据。数据的孤岛一旦打通了,投后管理的话就有很多的事情可以做了。
个人方面,对于人工智能产品和技术的使用还是比较少的。有一些人可能会写一些程序来帮他们炒股,但是并没有一种平台或者是软件去帮助个人做这些决策,比如说要如何根据自己的特点,智能的决定去投资哪一方面。这个方面目前是缺失状态,能够有机会做好的话,应该是一个非常不错的市场。
山世光:
从过去的无人售货机到商品更加丰富的无人零售店,个人认为是有这方面的需求的。比如说物流基本不会在大半夜给你送东西,但无人零售店则可以满足你的需求。所以我个人是比较看好这一块的。从技术的角度来讲,难以避免的是会存在着误差,无论是商品的识别还是对购买人的识别,可能都会有一定误差。如何去容忍这个误差,以及这个误差会带来多少的损失,是解决问题的关键。
另外,在误识别的情况下,我们往往会倾向于不要让顾客多花钱。但即便如此,他们在付款之后,一看价钱不对依然会有困恼。这就需要形成完整的解决方案,来尽可能解决这些问题。
郑宇:
我的观点比较务实,关键是要把实体店和线上的定位区别开。能不能做到短平快,物流的算法很重要。如果东西不新鲜了,为什么过去买呢?定位不精准的话,这个东西就没有深度。所以应该用 AI 来保证物流而不是识别。识别不是重点,不管是扫码还是刷脸,只要好用,用户就可以接受。
三、如何看待中美 AI 战略的差异
山世光:
我觉得现在中国在 AI 的应用方面,是走在前列的。特别各大企业,包括国家,都有政策和资金的支持,人力物力财力各方面都做了大量的投入。有投入就一定会有产出,我们有这么大的市场,我们确实也走在了应用的前列。但是,在聊到这个话题的时候,我确实有一点担心,担心体现在中美差异上。
在 AI 的基础研究的层面上,我觉得国内其实相对来说要偏弱了一点。这种偏弱可能和我们刚才说的资源大量投入到应用上面有一定的关系。从人才的培养角度来看,我们注意到了研究生的心态,其实是有变化的。现在工作太好找了,工资也高,所以特别优秀的研究生选择在本科毕业或硕士毕业就出去工作,而不是继续投入到 AI 的基础研究领域。
事实上,AI 这个领域,我们只走了万里长征的前几步,大量的问题没有解决。在这个阶段如果我们有一点釜底抽薪的味道,把前面的基础研究过早砍断的话,对后面的长期发展未必有利。我有时候会反思这样一个情况,期望我们工业界还是要有一点克制,一部分优秀人才还是应该鼓励他们留在基础研究这样一个行业里面,使得我们不会后继乏力。以免等到后面又冒出一个,不是深度学习而是其他的方法论来解决更多的问题的时候,我们又没有跟上。这是值得我们反思和注意的地方。
郑宇:
因为我们多年来一直和政府合作,我自己也在学校里面兼职做教授,这么多年下来,我觉得要考虑的是政府、传统行业的公司和 IT 公司和学校如何分担自己的责任,做到四位一体。政府就是出政策,鼓励开放数据和合作,政府提不出问题,大家不要怪政府,因为政府不是行业专家,更不是数据科学专家,让政府提一个具体的问题和提需求,不现实。需求是传统行业公司,传统的交通公司和金融公司,传统的电力公司要提出来的。他们提供专业的知识和技能, IT 互联网公司提供大数据、平台和基础设施保障,然后学校跟企业联合培养人才。就刚刚山世光说的这一点,学校单纯靠自己的实力留学生是留不住的,而且学校里面不具备这种条件,单靠几个案例,没有大数据的平台和数据培养不起来的,最后还是需要企业和学校联合培训。各个部门不要越权干自己不该干的事情,政府搞研究的话本身就不是最优的,政府出政策,传统行业提需求提问题,学校和企业联合培养人才才有希望。
颜水成:
这件事我是也比较乐观的。美国在理论层面比中国强,这是不争的事实;中国慢慢在应用层面已经赶上或者是超过美国的话也是一个事实。把 AI 的理论研究透了,可以对这个产业产生价值是肯定的。但好的是,我们并不需要把理论研究得那么透,也会对社会的方方面面产生积极的影响。
中美的人工智能,我觉得非常像医药。美国像是西医,中国像是中医。并不需要去了解里面的所有的理论,以及真实的成分是什么东西,通过试验,通过验证,它有效果,而且是有价值的即可。所以从这个层面来说,我觉得也不要太多的担心中国人工智能的理论,可能目前的人力资源积累并不是特别多。但是它可以给中国的经济带来积极的价值,这是明摆着的。另外,我们也看到了有更多的在理论知识深厚的教授从国外归来,在国内的学校里面或者是研究所里面做研究。
四、怎么平衡 AI 科学家和企业责任之间的冲突
林清咏(哥伦比亚大学客座教授、Graphen CEO)
我在学校呆了十几年,在企业界呆了二十年。我认为二者都非常重要,基本研究很重要,应用也很重要。我的策略就是想办法把我的团队养大,一部分人专门负责基础往前提升,另外一部分人专门负责解决当前还没有解决的问题。比如说现在我们的基础团队利用金融市场和做金融行业来把 AI 的能力往前进,把我们的系统带进美国排名第一的做癌症的研究中心,来分析过去二十年来几百万的病例,让这样的 AI 系统同时可以替人类解决癌症可能带来一线曙光。我们的学生最近也在用这个做老年痴呆症的研究。
山世光:
我觉得还是比较好平衡的。对我们来说,至少在 AI 这个领域做的大部分事情,无论是技术还是产品,它都可以推动这个社会的进步,关键看谁在用。从技术的角度来讲,一句话非常重要,就是价值会决定价格。只要是有存在的价值,或者是满足科学进步的需求,或者是说满足用户的需求,都值得我们去做。
苏中:
做了几十年的技术,心里是希望多做底层的技术,把技术做专做穿。但因为现在我在 IBM 的研究院,希望把技术应用在实际的场合中,所以有了另外一个方面的力量拉动我去做技术产生价值。这两者之间有的时候是矛盾的,有的时候是契合的,这是一个螺旋上升的过程。很幸运,AI 有一个很好的年代,我们做技术的人都有一个很好的机会。
颜水成:
我觉得学校出来的教授,普遍会有一个毛病,认为产品里面技术是一个很重要的部分。通过自己几年的实践,以及我的导师写的一本书里也有提到,其实你的技术在一个成功的产品里面最多能占30%-40%。要相信产品的成功,除了你之外还有其他的因素,大家一起协作,一起共赢就可以了。
End.
转载请注明来自36大数据(36dsj.com): 36大数据 » 浮沉发展 60 年,人工智能这波热潮还能走多远?