中国AI研究超美国?专家:比如深度学习已发文章数
(原标题:法国极客Yann LeCun: 掌舵 Facebook 人工智能)
钱童心
当今世界人工智能领域,有三位顶级专家被业内奉为“神一样的人物”,其中两位来自加拿大,一位来自法国。他们分别是加拿大多伦多大学的GeoffreyHinton和蒙特利尔大学的终身教授YoshuaBengio,以及Facebook人工智能研究部门(FAIR)负责人YannLeCun(下称“LeCun”)——这位来自巴黎的学者目前担任纽约大学终身教授,他还是纽约大学数据 科学 中心的创始人。
YannLeCun在今年3月走进中国的大学,在清华大学和上海纽约大学分别进行了两场人工智能的顶尖对话,并接受了第一财经记者的独家专访。
让机器拥有常识
LeCun是法国学界非常引以为豪的科学家,也是在美国科技巨头公司中担任要职的为数不多的法国人。虽然同为“极客”,但法国人独特的气质让LeCun和很多美国科学家相比,看起来更加随意、富有亲和力。
1987年LeCun从巴黎第六代大学的计算机系毕业后,就去了多伦多大学读博士后,师从“神经网络之父”GeoffreyHinton,Hinton也是将深度学习技术带入 谷歌 ( 微博 )的人。博士后研究结束后,LeCun就一直工作生活在美国,先后任职于贝尔实验室、AT&T等大公司。2008年他创立了一家从事大数据挖掘的咨询公司YLC,直到目前,他还担任他所创立的另一家从事音乐制作和教育公司的首席科学官。
目前LeCun领导着Facebook人工智能研究部门近百人的团队。他的工作是推进人工智能的基础科学与技术研究;通过实验来发展人工智能技术在各个领域中的实际应用,如计算机视觉、人机对话系统、虚拟助手、语音识别和自然语言处理(NLP)等。
“人工智能的背后存在很多基础科学,它们也许并不面向应用,你的研究可能只是通向对智能和人工智能的理解。”LeCun对第一财经记者表示。
LeCun开辟了将神经网络运用于机器视觉的先例。五年前,其带领研究人员在图像识别的准确性上,取得了巨大的突破,这背后的技术——人工神经网络,促成了近年来人工智能的繁荣,也使得谷歌和Facebook得以让人们在自己的相册中使用搜索功能,并促成了一批使用面部识别的应用程序问世。
训练机器如何学习是LeCun的团队最重要的工作。过去很长一段时间,他们给机器“喂”了成千上万张图片,来教会机器区分诸如“汽车”和“小狗”。不过LeCun在这个过程中也抛出了新的问题:当有大量可用样本(比如桌椅、猫狗和人)时,训练机器没有问题;但如果机器从来没有见过这些实物,它还能识别出样本吗?
LeCun表示,人工智能发展的一大难题就是怎么样才能让机器掌握人类常识,这是让机器和人类自然互动的关键。想要做到这一点,它需要拥有一个内在模型,以具备预测的能力。LeCun用一个公式简洁地概括了这种人工智能系统:预测+规划=推理。而研究人员现在要做的,就是不需依赖人类训练,让机器学会自己构建这个内在模型。
“人们花了很多年来研究如何给图片和视频自动加入字幕或描述,从目前的技术来看,确实也已经出现了令人印象深刻的实现方式。”LeCun对第一财经记者表示,“但实际上,它们并没有看起来的那么令人惊艳,那些机器的专业上很大程度受限于人们训练它的环境。你如果向机器展现非常规的情况,大多数机器就会不知所措,因为它们不具备常识。”
LeCun认为,在机器视觉领域还有很大的进步空间,机器视觉的下一个突破将会是以自主观察世界的方式进行学习,比如通过观看视频来进行学习。这也意味着未来计算机可能会像婴儿学习那样掌握常识性的知识。
关于机器视觉如何与常识相联系,LeCun说,就连Facebook内部也有很大分歧。“一些人认为可以与智能系统只进行语言交流,但是语言是一个相当低带宽(lowbandwidth)的渠道,信息密度很低。语言之所以能承载很多信息,是因为人们拥有大量的背景知识,也就是常识,来帮助他们理解这些信息。”LeCun解释道。
一些人工智能科学家认为,给人工智能系统提供足够信息的唯一方式是加入视觉认知,因为影像会比语言的信息密度高得多。比如,你告诉机器“这是一部智能手机”,“这是一辆压路机”,“有些东西你可以推动它而有些不可以”等等,也许机器能够学会这个世界的基础运作原理。对此,LeCun表示:“这跟婴儿的学习方式类似。然而,幼儿在学习很多事情的时候并不需要明确的指示。”LeCun认为在没有指导的过程中的学习才是他想要达到的。
他表示,Facebook很想做到的一点是,让机器通过观看视频或观察其他东西来认识现实世界中的很多局限性,这最终会让它们建立起常识。“目前机器还十分好骗,那是因为它们对这个世界缺乏基本理解。”LeCun说,“比如将来你给机器看一小段视频,然后机器就能预测接下来会发生什么。如果我们能训练系统做到这一点,那么我们就已经创造了无监管指导的机器学习的核心技术。这是我们人工智能宏图的重要组成部分。”
卷积神经网络
在超过20年的研究历程中,LeCun累计发表了超过180篇论文,他最广为人知的研究是1988年参与开发著名的卷积神经网络(convolutionalneuralnetwork,CNN),因此LeCun在业内也被称为“卷积神经网络之父”。
卷积神经网络是近年发展起来的一种高效识别方法。其最初的概念形成要追溯到上世纪60年代,科研人员在研究猫脑皮层中用于局部敏感和方向选择的神经元时,发现其独特的网络结构可以有效降低反馈神经网络的复杂性,继而提出了卷积神经网络。
现在,卷积神经网络已经成为众多科学领域的研究热点之一,特别是在模式分类领域,由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,得到了更为广泛的应用。这种革命性的系统从一开始能够识别手写数字,并且随着数据训练的不断持续,能够开始从图片像素中识别视觉特征,这就像为计算机打开了双眼,让它们可以从数据中自我学习。
LeCun对第一财经记者表示:“如今深度卷积网络已可用于解决包括目标识别在内的各类计算机视觉问题。并且,随着网络深度不断增加,还出现了可用于图像识别、语义分割、ADAS等众多场景的新型深度卷积神经网络结构。”
Facebook目前正在使用机器学习实现一系列不同的功能,这些功能包括人脸识别,机器能从网上识别出人脸,即使这个人的脸未被标注,因为这一技术是基于模拟人脑的神经网络实现的。
这些网络能够被训练,并识别信息中的模式,包括语言、文字数据或者视觉图像,也是近几年来大量的人工智能研发的基础。机器系统的下一步任务将是通过观察现实世界,学习世界的运作方式,其中一种方法是通过与智能手机和可穿戴技术的互动来学习。
从事人工智能领域研究20多年来,LeCun的目标就一直是希望赋予机器更大的能力,让机器变得更加聪明。他对第一财经记者表示,在Facebook还有很多想做的事情,还有很多使命尚待完成。“我希望能在Facebook看到新技术的应用,让我们的研究变得更有意义,通过提升机器的深度学习能力,将它变成智能机器。”
LeCun还认为人工智能未来能够无所不能,包括预测人们的行为。“机器的下一步是能够通过观察现实世界的万物来进行学习,并且预测。”LeCun在最新发布的推特和Facebook中,多次强调“无需监管和指导(unsupervised)的机器人前景可观”。
他认为,在进入到人工智能下一个阶段的突破时,Facebook面临的最大挑战将是如何通过机器学习将最好的内容与个人需求相匹配。去年4月,Facebook在F8大会上推出了Chatbot聊天机器人,能够帮助人们完成订餐和行程安排等任务。在LeCun看来,聊天机器人的终极目标是成为个人的虚拟助理,通过人工智能技术来连接人类和现实世界,执行日常生活中的任务。
LeCun对第一财经记者表示:“尽管短期我们还只能从一些简单的功能应用开始做,但我们的远期目标是建立一个真正的智能机器,让你可以与它直接对话,它需要能回答任何问题,并对你的生活提供帮助。这件事对于当今的人工智能而言非常具有挑战性,人机对话系统、自然语言处理,所有这些的基础在于让机器学会人类的常识。我们现在还不知道到底应该怎么做,但我们对此有很多想法。”
人工智能是长期投资
针对目前全球科技巨头在人工智能方面的激烈竞逐,LeCun对第一财经记者表示:“没有谁跑在前面。许多公司都在做着大量的人工智能研发,对于人才的竞争也很激烈,但现在并没有谁发明了远远领先于其他公司的新技术。”他补充道,没有哪家公司的新技术是需要别人花费三个月以上才能赶上的,大家的水平都很接近。处于第一梯队的包括Facebook、谷歌的DeepMind、 微软 和 IBM 。
对DeepMind发明的AlphaGo取得的成功,他表示:“这是人工智能领域的伟大胜利,我的一些学生和博士后参与了DeepMind的项目,这一成就建立在所有人的努力之上。”事实上,分析围棋棋盘并决定落子位置的系统实际上正是LeCun发明的卷积神经网络。不过他也承认,Facebook对围棋的研究并不多,和DeepMind的系统相比体量相差很多。“我们的围棋研究主要作为计划和勘探研究的载体。我们的系统工作得不错,然后我们把它开源了。”
在人工智能的商业化方面,LeCun表示:“基础研究的影响在比较长时间后才能体现出来。你不能幻想种下一颗种子,然后就突然冒出了实体产品线,商业形式就能发生彻底改变。这是一种长期投资,它需要的是有远见的人,这样的人谷歌有,Facebook也有。”
Facebook最近传出正在组建消费品部门的消息,对此LeCun向第一财经予以证实,不过他表示,新部门与他所负责的人工智能部门是两个独立的团队,并没有直接的联系。Facebook确实在研发消费市场的人工智能技术,有些是软件应用,有些是硬件,比如AR、VR和机器人等。“我们正在打造一个人工智能的生态系统,能够将各个部件与人的生活相连接。”
LeCun主张研究成果的开放,让更多人了解自己正在从事的研究。他表示:“要和大学实验室保持良好关系,让这些机构为你输出各类人才,进行各种可能的研究,就必须要开放项目和成果。假设你是一名科研人员,你肯定总是想公开发表你的研究成果,对于科学家来说这很重要,因为你的地位在于学术影响。你不能简单地告诉人们‘我正在为Facebook工作,但我不能告诉你们我在研究什么’,这样你的职业生涯就毁了,这很重要。”
人工智能科普大使
机器学习和深度学习等人工智能范畴的概念已经开始逐渐被普通人接受,但真正要理解和表达,对大多数人来说仍然十分困难。为此,LeCun近年来频频走进全球高校,积极推动人工智能方面的科普工作,他对第一财经记者表示:“帮助公众理解人工智能,对于推动整个行业的发展非常重要。”
在中国的行程中,LeCun还参观了中科院模式识别国家实验室。他在Facebook中发布的一张和中科院科研人员的合影中写道:“很高兴得知中国已经有了多个人工智能的国家级项目。”
他表示:“中国海外投资是很有意思的现象,中国公司的投资途径基本上是先在本土建立生态圈,再逐渐渗透到国外,进行海外扩张。事实上当我们看到越来越多中国企业投资海外项目时,也应该看到很多欧洲和美国的企业正在投资中国的人工智能领域。这种资本的流动是技术发展的必然。”
LeCun还表示,在一些人工智能的领域,中国已经超过美国领先全球。比如在深度学习方面,根据去年11月美国政府发布的报告,中国发表的文章已经超过美国。
但是和美国的科技巨头相比,中国的研究和技术仍然有差距。LeCun认为,两国的人工智能科研实验室存在很大差别,“Facebook和谷歌DeepMind的人工智能实验室真的是研究非常超前的东西,比如预测学习和人工智能的未来趋势,这是我在其他任何公司都没有看到过的。”
尽管人工智能在中国的应用已经无处不在,从缓解城市交通拥堵,到为司法系统注入透明度。但是现在中国面临的最大问题是专业人才紧缺。
针对人工智能领域激烈的人才竞争,LeCun表示:“中国占全球五分之一人口,这里拥有非常多的人才,扎克伯格非常重视中国市场。我们也和中国的大学和院校进行人工智能以及很多其他方面的基础研究合作,这对Facebook是有深刻意义的,但这不是说我们已经在中国开展业务了。”
人工智能的快速发展,不断带来惊喜的同时,也引发了各种担忧。有一种担忧认为Facebook正在使用人工智能去监视人们的行为。另外,随着人工智能的迅速增长,很多人担心机器人很快就会代替人类,甚至掌管整个世界。
LeCun表示:大可不必如此担心。“尽管人工智能发展安全系统的学习曲线是在向上的趋势,但机器最终还是会被人文社会均衡所控制。也许一个假设情境中的对冲基金可以通过破坏经济体系帮助人类实现收益最大化,但是这些行为最终会受到社会和法律制度的约束。”
LeCun曾在自己的Facebook上贴出一张美国漫画作家比尔·沃特森(BillWatterson)的著作《凯文的幻虎世界》(CalvinandHobbes)中的一张漫画,图中6岁的男孩和老虎躺在草坪上,他们并不能明白对方的世界。漫画中写道:“如果我都不知道你为什么大笑,我们的生活将没有太多的共鸣。”这段话也是LeCun对于人工智能和人类关系的总结:有机遇也有挑战,充满着迷人和激情的色彩,但又让人有未知的恐惧。