Facebook AI研究部门主管LeCun:通用人工智能远未到来
【编者按】 Yann LeCun 是 人工智能 界的著名学者,现任 Facebook 人工智能研究部门的主管,去年LeCun作为神经网络的先驱获得了Lovie终身成就奖。近日,LeCun谈到了他对人工智能的发展历程和未来趋势的看法。
本文转载自Buzzfeed,原文作者Alex Kantrowitz,网易智能菌编译,编译作者机器小易;由亿欧编辑,供行业内人士参考。
在距离Facebook美国门洛帕克市总部近5000公里的曼哈顿市中心一栋古老的米色办公大楼里,一群公司员工正在研究几个项目,它们看起来似乎与社交网络关系不大,而更像科幻小说中的场景。这就是Facebook的人工智能研究团队,简称FAIR。他们专注于一个独特的目标,即开发具有与人类同等智能水平的电脑。
尽管距离实现终极目标还很遥远,但这个团队正取得十年来几乎没有人敢相信的成就:它的人工智能程序绘制的画作几乎与人类艺术家无分轩轾,从维基百科上挑选的主题测验罕缝敌手,它还能玩《星际争霸》这样的高端视频游戏。慢慢地,它们变得越来越聪明。将来,它们可能会改变Facebook,让你与朋友之间互动的平台成为你的知心好友。
正是出于这些原因,FAIR显然不是典型的Facebook团队。这个团队的成员并不直接参与这家价值4100亿美元大公司的热门产品开发工作,比如Instagram、WhatsApp、Messenger和Facebook。它的最终目标可能需要几十年时间才能实现,而且可能永远无法实现。
它并非由典型的硅谷成功人士领导的,而是一位56岁的学者Yann LeCun(雅恩·乐昆),他在人生中经历了真正的失败,并成功地恢复过来。他曾经被拒绝的关于人工智能的理论如今被认为是世界上最先进的,Facebook给出的高额薪酬便是他个人价值的最佳证明。
LeCun表示:“你与数字世界(包括手机、电脑等)的互动将会发生改变。”FAIR正在提高电脑的视觉、听觉以及通讯能力,它的发现已经渗透到Facebook的各种产品中,从新闻推送到相机再到图片过滤器等。
Facebook正在进行大规模投资,这不仅是因为人工智能很有趣,还因为它非常重要。在当今科技的各个角落,公司都在以人工智能为基础进行竞争。Uber由AI支持的 无人驾驶 汽车成为其专车战略的核心。谷歌依赖AI的GoogleHome智能扬声器正在回答用户在搜索栏输入的任何问题(在此之前,谷歌还需要查阅百科全书)。
为了破解价值6740亿美元的食品杂货市场,亚马逊正在用人工智能收银员创建便利店。在Facebook,人工智能几乎无处不在。例如,它的人工智能照片过滤器可以帮助抵御来自Snapchat的挑战。它的人工智能可以识别图片,看看里面有什么,并决定在它的信息流中显示什么,这将帮助公司提供令人信服的体验,让你重新追溯过去。类似的技术还在监视骚扰、恐怖主义和色情内容,并将其标记出来以删除。
Facebook应用机器学习(AML)团队负责人杰奎因·奎诺内罗·坎德拉(JoaquinQui·oneroCandela)说:“人们对整个Facebook产品的体验都是基于人工智能的。如今,如果没有人工智能支持,Facebook就不可能存在。”
随着这个领域不断取得进步,Facebook将依靠LeCun和他的团队来帮助其领先于竞争对手,尽管后者很可能也会拥抱这种技术。经历了多年的批评和边缘化之后,LeCun终于拥有了梦想中的所有: 80名研究人员、Facebook庞大的金融资源支持以及对他工作的主流信仰。他现在所要做的就是交付成果。
视觉
从很小的时候起,LeCun就相信他能让电脑拥有视觉。面部识别和图像检测如今已经很常见,但是当LeCun20世纪80年代早期在巴黎上大学时,计算机实际上是个“盲人”,它们无法理解图像中的任何东西,也无法弄清楚相机镜头里出现了什么。
从上世纪60年代起,LeCun就在大学里寻找一种方法,这种方法在很大程度上还未被探索过, 但他认为这种方法有可能“让机器学习许多任务,包括感知。”这种方法被称为人工神经网络,它是由相互连接的小型传感器组成的系统,并可以将内容分解成微小的部分,然后进入识别模式,并根据它们的共同输入来决定它们所看到的内容。
在阅读了反对神经网络的论点,也就是它们很难训练,而且不是特别强大后,勒恩决定不管怎样都要继续前进。他在攻读博士学位的时候,尽管存在疑虑,但依然军心专注于此。对于当时受到的批评,LeCun说:“我就是不相信它们。”
人工智能领域的艰难时期有自己特殊的名字:人工智能寒冬。这些时期主要是因为研究人员的研究成果不符合他们的预期,使得研究成果似乎显得不够科学,导致资金和兴趣枯竭,阻碍技术持续进步。
LeCun同样遭遇过人工智能寒冬。 上世纪90年代中期,在贝尔实验室的一项人工智能研究工作结束后,AT&T的内部纷争让他的团队分崩离析,当时他们正在推出自动读取ATM机,即如今仍在使用的神经网络技术,就像LeCun认为它正在取得明显进展一样。 LeCun说:“整个项目在取得真正成功的那天就被解散了,这真的很令人沮丧。”
与此同时,其他方法获得主流研究人员的青睐。这些方法后来不再受欢迎,但它们的崛起足以让神经网络以及其长期以来的支持者LeCun被挤入边缘。21世纪初,其他学者甚至不允许LeCun在他们的会议上发表论文。
神经网络先驱、谷歌高级工程师、多伦多大学教授杰夫·辛顿(GeoffHinton)表示:“基本上,计算机视觉社区已经拒绝了他,而他的观点是自己正在做80年代非常有前途的事情,但他现在应该已经完成了。然而,这已经不再是我们的观点了!”
其他神经网络研究人员当时也遇到了类似的问题。人工智能领域先驱、蒙特利尔大学教授约书亚·本吉奥(YoshuaBengio)当时甚至很难找到愿意与他合作的研究生。他说:“许多学生不愿意从事这类研究,因为他们害怕在完成博士学业后找不到工作。”
2003年,LeCun为自己获得救赎奠定了基础。那一年,他加入了纽约大学的教师队伍,并与辛顿和本吉奥一起,以非正式联盟的形式重新恢复了神经网络。LeCun微笑着说:“我们开始了我所谓的深度学习阴谋。”
“深度学习阴谋”在这个领域发挥了关键作用,主要是因为他们坚持自己的信念,即为每一种你想要探测的对象建立专门的神经网络,你可以用同样的模板来构建一个可以检测图像、视频和语音的神经网络。所以,与其分别建立能够发现企鹅和猫的神经网络,还不如建立单独的神经网络来检测两者,并区分它们。
这些新的神经网络也可以用于其他任务,比如通过查看音频波来检测语音模式。这个阴谋的研究得到了两个重要外部因素的支持:第一是计算能力增加,这使得它的神经网络运行速度足够快,也更加实用。第二,由于互联网的广泛应用,可用数据(图片、文本等)呈指数增长,而且可用的数据可以通过网络进行大量处理,从而使它们变得更智能化。
最终,这个结果成为了一种敏捷、快速、准确的方法,为该领域开辟了新的可能性。在LeCun和同行们建立的基础之上,计算机视觉在21世纪初出现了爆炸式增长。计算机开始能够识别图像中的物体,然后识别视频中的物体,最后甚至可以识别摄像头中的目标。现在,只要你把摄像头对准篮球,AI就能理解它在看什么。
LeCun很快从“场外人”成为这个领域的领袖。他说:“在1年时间内,它从无人问津变成人人都在研究的东西,“这简直太疯狂了!”
2013年12月,LeCun加入了Facebook,对于想要将人工智能研究应用于照片的人来说,这是个理想环境。Facebook的平台上有数十亿张图片,让LeCun和他的研究人员可以用大范围的画布来实现新的想法。
FAIR经常与AML合作,将其在Facebook上的研究付诸实施。这两个团队建立了新的系统,推动公司的技术不断进步。目前,AML正在利用FAIR的研究来帮助确定新闻推送内容中应该向你显示的内容,并将其翻译为Facebook内部的内容。这种技术还被应用到Facebook的摄像头中,以产生对你的动作做出反应的特殊效果。
思维
教授计算机去看是教授它们理解世界如何运作的基本步骤。人类理解这个世界是如何运作的,因为我们会反复观察各种情景,并对它们的表现产生理解。当一辆汽车从我们所处的道路上疾驰而过时,我们预测它可能会撞上我们,所以我们就会让开道路。当天黑时,我们预测开灯会让它再次亮起来,所以我们就会去开灯。
FAIR试图教会计算机预测结果,就像人类那样,并使用类似的方法。LeCun解释说,这支团队正在向其人工智能播放大量相关视频,然后在某个时间点暂停,然后让机器预测接下来会发生什么。举个例子,如果你反复地向人工智能系统展示水瓶从人的头部顶上翻转的视频,那么它就有可能预测到这个动作会让人淋湿。
LeCun解释称:“从某种程度上说,智力的本质就是预测能力。如果你能预测到你的行为会产生什么样的后果,那么你就可以提前计划了。为了实现特定目标,你可以计划一系列的行动。”
教授人工智能预测是当今领域最棘手的挑战之一,这在很大程度上是因为在许多情况下,多个可能的结果在理论上都是正确的。LeCun说:“想象一下,在桌子上竖起一支笔,然后放手。如果你问电脑,1秒之后笔在哪里,可能没有正确答案。机器知道笔会倒下,但它不知道会落在哪里。所以你需要告诉系统,有很多正确的答案,而实际上发生的只是某些替代方案中的一种。这就是在不确定的情况下学会预测的问题。”
帮助人工智能理解和拥抱不确定性是人工智能“无监督学习”领域的重要组成部分,也是目前AI领域的前沿。 当人工智能通过观察足够了解世界的运作方式,并预测接下来会发生什么时,它就会开始像人类那样思考,获得一种常识。LeCun认为,这是让机器变得更聪明的关键。
LeCun和他的研究人员认为,人工智能很可能需要数年时间才能完全欣赏到“灰色地带”,但他们相信最终能够实现这个目标。LeCun团队的研究经理拉里·兹特尼克(LarryZitnick)说:“这个目标肯定能实现。但我想说的是,可能还需要10年时间。”
语音
2016年12月份,马克·扎克伯格(MarkZuckerberg)发表了一段引人注目的视频,展示了他的“人工智能管家”贾维斯(Jarvis)。它由Facebook创始人亲自编写代码,贾维斯为扎克伯格制作吐司,在识别出父母的脸后允许他们进入他的房子,甚至教他的宝贝女儿麦克斯上中文课。
贾维斯真的很酷。但对LeCun来说,这没什么特别的。他说:“这基本上是脚本化的,而且相对简单,从某种程度上来说,这种智能依然是相当肤浅的。”他的眼光显然更高。
LeCun也想要开发助理,但他希望这些智能助理能够真正理解你告诉他们的事情。他说:“这些机器能够进行对话,能够提前制定计划,你不会因为它们愚蠢而生气。”目前还没有这样的机器蓝图,但FAIR正在研究可能的建筑模块。
让AI对这个世界有个初步的了解,并对它进行训练,以预测其内部可能发生的情况。教它阅读和写作也是如此,FAIR正使用神经网络实现这个目标。对计算机来说,图像就是一组数字,但一个口语句子也可以被表示成一组数字,就像文本那样。因此,像LeCun这样的人可以使用神经网络体系结构来识别图像中的对象、句子中的单词或文本中的主题。
人工智能仍然无法像理解图像的方式理解文字,但是LeCun已经有了一个关于终极贾维斯可能是什么样的设想。他的理想智能助理应该具有常识,并可与其他助理进行沟通。比如,如果你想和朋友一起去听音乐会,你会告诉你的助手进行协调,它们会比较你们的音乐品味、日历和方便时间,然后给出建议。
LeCun谈及面临的挑战时称:“这种机器必须了解某种形式的世界状态。比如,人们不能同时住在两个地方,人们不能在短时间内从纽约到旧金山,考虑到旅行的费用,你需要知道很多事情才能安排好一个人的生活。”
Facebook目前正在试验简单版本的数字助手M,由其Messenger团队管理,并依赖于FAIR的某些研究。FacebookMessenger最近发布了“M建议”,在它认为可以提供帮助的时候,M会参与到对话中。
当有人问“你在哪里?”Messenger可以弹出对话,并让你可以点击分享自己的位置。Facebook很可能会将这个功能扩展到更高级的用途中。
Messenger是Facebook努力使用人工智能理解含义的一种应用,但该公司正在考虑以其他方式使用这种技术。它甚至可能会投入到工作中,努力打破最近被指责帮助建立起来的障碍。
甚至在2016年大选之前,人们就开始关注Facebook上的两极分化和虚假新闻,LeCun团队的成员Y-LanBoureau正致力于利用人工智能在Facebook上打造更具建设性的对话。Boureau同时研究神经学和人工智能,在用了一个夏天时间看她的朋友们在Facebook上互殴,双方几乎没有兴趣听对方的观点后,她决定发起这个项目。
Boureau解释说:“如果我们能更好地理解是什么驱使人们处于当前的思想状态下,他们的观点是如何形成的,为何陷入僵化,以及如何最终让两个人无法相互交谈,这将是非常好的事情。”Boureau想要创造这样一个世界:在人们付诸行动之前,可以看到尽可能多的不同意见,直到我们开始把它们调整为我们的观点。
人工智能可以通过在文本中绘制模式,理解某些东西在哪里偏离了轨道,并可能找到一种改变对话流的方式来阻止糟糕的转变,从而帮助解决这个问题。Boureau说:“如果我们更加了解学习过程,以及这些信念是如何从数据中获得的,那么就更容易理解如何获得更有建设性的对话。”
在2016年大选之后,LeCun曾公开表示,Facebook拥有使用人工智能过滤虚假新闻的技术能力。有些人认为,他的声明是解决美国普遍存在的两极分化问题的解决方案之一。但LeCun表示,这项任务最好留给第三方,而不是那些能够引入偏见的机器。他说:“人工智能可以在这个过程中发挥作用,但这是一个非常困难的产品设计问题,而不是技术问题。你不想让别人产生某种特别的意见,你想在这方面保持中立。”
现实
对人工智能领域来说,炒作周期可能是危险的,LeCun非常清楚这一点。而今天,我们似乎已经置身其中。在2013年第一季度,六家公司在财报电话会议上提到了人工智能。据彭博社报道,在2017年第一季度,这个数字增加到244个。
在讨论未来时,LeCun非常谨慎地表达自己的观点。他说:“AI距离我们想要的目标还很远,“这些东西的效果不像我们希望的那么好。”事实上,正如LeCun警告的那样,人工智能还远未达到人类的智能水平,即所谓的通用人工智能。
尽管如此,LeCun还是无法抑制他对AI的热情。他对对抗训练特别感兴趣,这是一种相对较新的人工智能研究,可以帮助解决目前该领域面临的预测和不确定性挑战。这种技术让两个人工智能系统相互对抗,以便让它们了解真实的世界。
例如,在FAIR的实验中,一个研究人员使用人工智能系统绘制图片,试图欺骗另一个人工智能系统,让后者以为它们是由人类绘制的。而前者可利用后者的反馈来学习如何更好地绘画。
在今年早些时候的一次会议上,LeCun展示了一种更为先进的技术:让AI根据一段视频,脑补出一段后续的视频,还得骗过另一个AI的法眼。LeCun说,对抗训练“是过去10年或20年机器学习研究中最棒、最酷的想法。”因此,勒恩将继续进行对抗性训练,并再一次将这个领域推到极限。
对于20年前就听不懂他在搞什么的人来说,LeCun已经走得越来越远。虽然LeCun将是第一个告诉你工作还远未结束的人,而且距离成功依然很遥远,但他并不是坐视时光流逝的人。他说:“我不能说这感觉很糟糕,而是棒极了!”