人工智能的下一步是什么?Gary Marcus :走出有缺陷的深度学习,四个步骤实现强AI
公众号/AI前线(ai-front)
作者 | George Anadiotis
译者 | Sambodhi
策划 | 刘燕
Gary Marcus 认为,人工智能不可能只是机器学习或深度学习。我们需要更丰富的综合方法才能取得进展。
本文最初发表于 ZDNet,经原作者 George Anadiotis 授权,InfoQ 中文站翻译并分享。
Gary Marcus 是人工智能领域最杰出和最具争议的人物之一。除了对深度学习的批判(这是很多人对他的认识)之外,Marcus 还为强大的人工智能提出了一个全面的建议。
Gary Marcus 作为一名畅销书作者,他没有什么特别的写作天赋。但作为一名学者,他创立了两家初创公司——一家被 Uber 收购,另一家刚刚获得 1500 万美元,旨在让制造更智能的机器人变得更加容易。虽然他具有人文科学背景,但却成为人工智能领域中比较突出、也比较有争议的人物之一。
Gary Marcus,是人工智能领域的杰出人物。他的职业生涯致力于理解智能,这也是他研究人工智能的方法的基础。
假如你认识 Gary Marcus,那么你可能就知道很难概括出像他这样的人。假如你不知道,现在是你改变状况的机会。Gary Marcus 是一位科学家、畅销书作者和企业家。Marcus 在人工智能圈子里声名鹊起,这主要是由于他对一系列话题的批评,以及随后引发的一些争论,包括智能的本质、深度学习存在的问题,以及四行代码是否可以作为植入算法时灌输知识的一种方式。
虽然 Marcus 有时被认为“几乎是 DeepMind 和 OpenAI 这样的组织的专业批评者”,但是他的身份远不止此。
ZDNet 对 Marcus 进行了广泛的主题采访,这是 Marcus 即将在 Knowledge Connexions 上进行的关于人工智能未来的主题演讲 的前奏。今天是采访的第一部分。
从认知心理学到人工智能
2020 年 2 月,Marcus 发表了一篇长达 60 页的论文,题为《人工智能的下一个十年:迈向强大的人工智能的四个步骤》(The Next Decade in AI: Four Steps Towards Robust Artificial Intelligence)。从某种意义上说,这是 Marcus 对批评他的人的回应,他超越了批评,提出了具体的建议。
遗憾的是,引用 Marcus 的话说,当今世界上还有更大的问题要处理,所以这篇文章不会像爆发新冠肺炎疫情之前的世界中那样被讨论。我同意,但我认为是时候改变了。从他的背景到 人工智能的争论,从他最近的论文到 知识图谱,我们都讨论过。
Marcus 是一名训练有素的认知心理学家。对一些人来说,这可能有些奇怪:一个拥有人文科学背景的人,怎么会被认为是人工智能领域的顶尖人物之一呢?这在我们看来并不那么奇怪。当 Marcus 开始讨论这个问题时,这一问题变得更加有意义了。
Marcus 从尝试理解人类思维的角度来研究人工智能。当 Marcus 还小的时候,他就开始给计算机编程,但是不久他就对 20 世纪 80 年代的技术状况感到不满。
Marcus 意识到,人类远比他所能编写出的任何软件都更聪明。在高中的最后几年,他用自己编写的翻译器将拉丁语翻译成英语,他说这是他第一次严肃对待的的人工智能项目。但是,随后他意识到了关键问题:
“我可以通过一系列的技巧来学习一学期的拉丁语,但是学得不太深,也没有别的什么东西可以深入。最后,我开始了对人类语言习得和人类认知发展的研究。”
Marcus 与他的博士生导师 Steven Pinker 合作。他们致力于研究人类是如何习得语言中哪怕是简单的部分,比如英语的过去式。Marcus 花了很多时间将当时流行的神经网络与人类儿童的做法进行比较。这些神经网络销声匿迹,后来在 2012 年重新出现。
当它们重新出现时,Marcus 意识到它们都存在着他在早期一些技术工作中所批评的所有问题。在过去十年来,Marcus 已经花了大量时间试图研究我们对儿童如何学习世界、语言等方面的了解,以及这些能告诉我们,要想在人工智能领域取得进展,我们可能需要做些什么。
科际整合、辩论与错误的做法
作为一名跨学科的认知科学家,Marcus 一直在尝试将我们从许多领域所了解到的知识整合在一起,以解决一些真正困难的问题。心智是如何工作的?它是如何发展的?它在时间上是如何进化的?
他也因此成为了一名作家,因为他发现不同领域的人并不能用彼此的语言交流。只有彼此了解,才能将不同领域的人联系起来。这是促使他成为作家的动力。他开始为《纽约客》(New Yorker)撰稿,写了五本书,包括《代数的头脑》(The Algebraic Mind)、《克鲁格》(Kluge)、《心智的诞生》(The Birth of the Mind)和《纽约时报》(The New York Times)畅销书《吉他 Zero》(Guitar Zero)。
不知什么时候,人工智能又开始流行起来,Marcus 觉得“所有人都在做错误的事”。这个想法激励他成为一名创业者,因为他想用不同的方法进行机器学习。Marcus 在 2014 年创立了他的第一家公司:Geometric Intelligence。在公司成立之初,Uber 就收购了它,而 Marcus 帮助成立了 Uber 人工智能研究室。
Marcus 在 2019 年推出了一家名为 Robust AI 的新公司,其目标是 “打造出更加智能、可信赖的、能独立工作的一代机器人”。Robust AI 不只是在装配线上操作和工作,它还希望制造能在各种环境下工作的机器人:家庭、零售、老人护理、建筑等等。Robust AI 刚刚筹集了 1500 万美元,因此显然进展正在进行中。
Marcus 认为,他的活动是以建设性的方式相互启发的。但是,他也认为现在的人工智能文化是不幸的,他指的是他与深度学习阵营的人们的争论,如最近 获得图灵奖的 Yoshua Bengio、Geoff Hinton 和 Yan LeCun。
你们有这么一群曾经不为人所知的人。如今,他们掌权了。我觉得他们并没有从被忽视的感觉中学到什么,而是忽视了很多其他人。由于我不害羞,而且我也有一定的勇气……不像我们的医护人员所拥有的那种勇气,但是我已经走上了另一条不同的前线,并说:
“这是我们需要做的。目前还不流行,但这就是为什么那些流行的东西不起作用。这导致很多人对我感到恼火。但是我想,你知道,我是从我父亲那里学到的坚持信念的,我也是这么做的。”
语言模型不知道自己在说什么
个人化并不是在科学或技术上取得进步的最佳途径。Marcus 承认自己在这些争论中花费了大量的时间,并表示自己遭到很多(言语)辱骂,特别是在 2015 年到 2018 年期间的推特上。他接着补充说,好的一面是,这引起了人们对这一问题的关注。
“就连深度学习领域的领导者也承认这种炒作,也认识到了我多年来一直指出的关于泛化和外推的一些技术上的局限。人工智能能提供的东西很多,或者,如果我们做得更好的话,还能提供很多。我很高兴看到人们开始关注更广泛的想法。但愿这样能让我们走得更远。”
Marcus 对深度学习的批判主要集中在像 GPT-2、Meena 以及现在的 GPT-3 这样的语言模型上。其要点是,这些模型都是基于一种“蛮力”的方法。虽然它们被誉为人工智能最伟大的成就,但 Marcus 仍然持批评态度,并不赞同。在他的文章以及《人工智能的下一个十年》(Next Decade in AI)的论文中,Marcus 对语言模型提出了令人信服的批评:
“这些都是近似值,但它们的近似值是语言使用,而不是语言理解。所以你可以得到关于人们如何使用语言的统计数据,如果你有一个足够大的数据库,你就可以做一些令人惊叹的事情。他们就是这么做的。
举例来说,你可以根据相似的句子中的词语,在一个千兆字节的大型数据库中预测句子中的下一个单词,这种方法在本地通常很好用。这些系统在预测类别方面非常出色。那么如果你说我有三个这样的,两个这样的,一共有多少个呢?它一定会给你一个数字。它会知道接下来应该有一个数字,因为人们在特定的语境下使用数字。这些系统完全没有的是对自己所讲的东西的真正理解。”
Marcus 已经完成了基准测试来证明自己的观点,并分享了他的结果。对于理解接下来将要发生的事情的总体类别和世界上实际发生的事情的细节之间的区别,他使用了简单的问题:
“如果我说,我把三个奖杯放在桌子上,然后再把另一个奖杯放在桌子上。那么我有几个奖杯?作为一个人,你可以很容易地把三个和一个相加起来。你建立了一个关于有多少东西的思维模型。你可以解释这个模型。但是这些系统,如果你说我把三个奖杯放在桌子上,然后再把另一个奖杯放在桌子上,那么一共有多少个?
它们可能会说七或十二个。它们知道这应该是一个数字,但它们实际上并不理解,你所说的是一组在某个特定位置可数的物体,它们不知道如何进行计数。接着出现更多的模型,数据库更大,我有一些例子,比如,你最喜欢的乐队叫什么名字?“七级炼狱”(Avenged Sevenfold)。然后他们又问了同一个系统一个问题:你最不喜欢的乐队叫啥名?又是“七级炼狱”。任何一个人都会意识到,你最喜欢的乐队和你最不喜欢的乐队不可能是同一个乐队,除非你在撒谎或者想要恶搞。但这些系统并不明白这一点。”
人工智能的下一个十年
Marcus 指出,这是一个非常严重的缺陷,可以追溯到 1965 年。ELIZA 是第一个专家系统,它只是匹配关键词,与人们谈论治疗的方法。因此,Marcus 认为,并没有什么进步,除了像下棋这样的狭窄领域之外,并没有像 Ray Kurzweil 这样的人所宣称的指数级进步。
例如,我们仍然不知道如何制造一个能够理解对话的通用系统。与此相反,我们只需要更多的数据和更大的模型(因此也需要更多的计算)。Marcus 对此不敢苟同,他指出,人工智能模型一直在增长,消耗了越来越多的数据和计算,但潜在的问题依然存在。
最近,深度学习的开拓者之一,Geoff Hinton 声称,深度学习能够完成任何事情。但 Marcus 认为,取得进展的唯一途径是将已经存在的“积木”组合在一起,但目前还没有一个将现有的人工智能系统组合在一起的系统。
Gary Marcus 认为,人工智能不可能只是机器学习或深度学习。我们需要更丰富的综合方法才能取得进展。
第一:与 经典人工智能 世界的联结。Marcus 并不是建议放弃深度学习,而是将其与经典人工智能的一些工具结合起来。经典人工智能擅长表示抽象知识,表示句子或抽象。目标是拥有一个能够使用感知信息的混合系统。
第二:我们需要有丰富的知识具体化方式,我们需要大规模的知识。我们的世界充满了大量的知识碎片。大多数 深度学习系统 不是这样的。大多数情况下,它们只是充满了特定事物之间的相关性。因此,我们需要大量的知识。
第三:我们需要能够对这些事情进行推理。假设我们对物理对象及其在世界中的位置有所了解,例如,杯子。这个杯子里有铅笔。然后,人工智能系统还需要能够意识到,如果我们在杯底挖一个洞,铅笔就会掉出来。人类一直进行这样的推理,但是目前的人工智能系统却无法做到这点。
第四:我们需要认知模型:我们大脑内部或计算机内部的事物,这些事物可以告诉我们世界上所见的实体之间的关系。Marcus 指出,某些系统有时可以做到这一点,以及为什么它们能作出比深度学习单独作出的推论更复杂的推论。
有意思的是,Marcus 的建议看起来与实际生活中的技术水平非常接近。但是,当我们试图总结如此丰富的对话时,在如此深奥的话题前,似乎只能窥见冰山一角。下个星期,我们将再次探讨更多的话题和细微差别,并将讨论锁定在具体的方法和技术上。
作者介绍:
George Anadiotis,特约撰稿人。熟悉技术、数据和媒体。现为 Gigaome 分析师,为财富 500 强、初创公司和非政府组织提供咨询服务、建立和管理各种规模的项目、产品和团队。
原文链接:
https://www.zdnet.com/article/the-next-decade-in-ai-gary-marcus-four-steps-towards-robust-artificial-intelligence/#ftag=RSSbaffb68