英伟达 Bryan ：除了围棋，人工智能下一个让人惊讶的领域是什么

IT思维 • 7年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

本期邀请到的嘉宾是英伟达副总裁、深度学习应用研究部分负责人布莱恩· 卡坦扎罗（Bryan Catanzaro）。他拥有计算机科学学士学位和杨百翰大学（BYU）俄语学位，杨百翰大学电气工程硕士学位，以及加州大学伯克利分校（UC Berkeley）的电气工程和计算机科学双料博士学位。

Bryan Catanzaro曾于2014年6月加入百度。他在百度带领了一个15人的研发团队，探索语音识别领域，训练和部署深度神经网络的工具和方法。在来百度之前，他在英伟达就职了3年，并于2016年9月离开百度，重新加入英伟达，成为英伟达深度学习应用研究部门的副总裁。

人工智能是一种智能工具

Q：我一般喜欢以这样的问题开场。请问什么是人工智能？

Bryan Catanzaro： 这是一个非常好的问题。我喜欢把人工智能看作是可以实施智力作业的工具。希望这些都是有用的工具，从而为人们提供必要的帮助，以提高效率。现在对人工智能的思考有许多，也许我今天所谈论的角度比较单一。

我主要关注人工智能为变革所做出的贡献，人工智能正在使众多公司以及世界经济运作方式发生改变，这就是因为它切实能够帮助人们在工作中提升效率。人类所创造出的工业化社会，体现在高度的机械化以减少体力劳动。人工智能正在制造能够进行智力工作的工具。

Q：那换一个角度思考。它之所以为人工是因为其并不拥有真正的智慧，而是在假装如此，甚至可以怀疑它是否真的如所说的那样聪明呢？难道是因为我们制造了它，所以把它叫做“人工”智能，而事实它还真的很聪明呢！

Bryan Catanzaro： 我之前很喜欢读到过的Yuval Harari的这个想法，他认为智力和感觉之间有所区别，智力更多的是指做事情的能力，而感知能力更多的是关于自我意识以及能够以人类理性的方式思考。我坚信，我们正在建立愈加智能的体系以执行我所说的智力工作。

我们可用摄像机或音频等传感器来测量，或者我们可以用文字记录等形式记录下来。解读这些数据并做出决定的过程，就是一种脑力劳动，而我们可以在此领域创造出越来越智能的机器。我认为人工智能的定义更趋于意识和感知，而我认为人类整体对此所做出的理解则有所偏差。

当然，也有一些人对制造通用性智能机器非常感兴趣，但我认为那是更遥远的事情，而且我不太了解如何定义通用智能机器，独立研究此项工作就更不可能实现。我的工作主要集中于更加实际的项目——帮助计算机理解数据并做出决策。

Q：我想，即使是从狭窄的人工智能角度看，假设我的草坪变干了，洒水器出现，它也会对周围的环境做出反应。那是所说的人工智能吗？

Bryan Catanzaro： 我想说这是人工智能的非常小的一种形式。你可以配置一个非常智能的洒水器，它比任何一个人都能够更为准确及时地知道什么时候需要浇水。它可以将各种传感器数据考虑进去。它也可以将历史信息考虑进去。

实际上，它可能比人类更了解应该如何灌溉。这是一种非常狭义的智能，但却非常实用。所以，我的确认为这可以被看作是智能的一种形式。现在，暂不探讨灌溉的本质以及其对地球的危害，抑或人类对地球干预的历史等等。所以它的角度很狭隘，但很实用，而且它的智能以自己的方式体现。

迁移学习技术会实现通用人工智么？

Q：接下来我想简单谈论一下AGI（通用人工智能）。就在这个狭窄的人工智能世界里，在你使用数据和电脑解决问题的世界里，如果有人说：“布莱恩，什么才是最先进的？”我们的人工智能发展到了什么程度？还是说这仅仅是开始，你并没有看到任何东西呢？或者我们真的做了很多很酷的事情，并正在努力去控制这个世界？”

Bryan Catanzaro： 我想我们才刚刚开始。在过去的几年中，我们已经取得了很大进步。我们在很多不同领域都有着非常惊人的进展。这一切都是从图像识别和语音识别开始的，但它已经远不只如此。

我们每天在互联网上与之互动的许多产品都使用人工智能系统，它们为我们提供了价值。它们为我们提供社交媒体消息流，提供推荐和地图，它们提供像Siri或Android助手这样的对话界面。

所有这些东西都是由人工智能驱动的，但仍处于起步阶段。有太多的事情我们还不知道如何去做，还有很多有待发掘的问题需要思考解决。因此，我相信在未来相当长的一段时间里，我们将继续看到人工智能应用在新领域里出现。

Q：如果我以一只猎鹰的小雕像为例，假设它有一英尺高，我把它展示给你看，然后我给你找出一些照片，然后说，“找出猎鹰。”它可以躲在一棵树的后面，可能在水下，也可能它被涂上了花生酱。人类可以很好地识别出来，但电脑还远不能做到这点。这是我们擅长迁移学习的一个案例吗？是否因为我们已经熟悉了东西上有花生酱的样子呢？有什么事情是人类正在做的，而电脑却很难做到呢？

Bryan Catanzaro： 我相信，人类在很长一段时间内都在运用我们所拥有的感受器在地球上在逐步进化。因此，我们利用许多已有的与生俱来的知识，告诉我们应该如何处理我们所拥有的感受器，并对世界进行建模。很多都是本能，有些是后天习得的。

我们有非常复杂的世界模型，也许我们认为这是理所当然的，因为每个人似乎都很容易理解。这不是你必须在学校里学习的东西。但这些模型实际上非常有用，而且它们比我们目前用人工智能技术构建的模型要复杂得多，使用也更普遍。

关于迁移学习的问题，我觉得我们很擅长在我们目之所及的范围内进行迁移学习。在很多情况下，人工智能在迁移学习方面会做的更好。实际上，关于世界是如何构造的，物体是怎样的，物体实际上的组成等可能会有更少的假设。我认为我们不应该忘记我们所做的事情并不是事出无因。我们根据本能行事，且其非常复杂。

Q：你认为我们是否应该学习如何将人工智能具体化，让它在世界各地试水，并让它们进行各种各样的探索呢？你是这样想的吗？我们该如何克服这一点呢？

Bryan Catanzaro： 这是一个有趣的问题。我个人并没有在努力打造人工智能，但对于那些正在研究人工智能的专家来说，人工智能初期发展应是什么模样将是一件非常有趣的事情。

我确实认为童年是人类智力发展非常重要的一个部分，它在人类智力发展中扮演了非常重要的角色，因为它帮助我们建立和校准这些世界的运作模式，然后我们在各种各样的事情中都有所应用，比如前面提到的猎鹰雕像问题。

计算机也需要这样的东西吗？有可能。我们得拭目以待。我认为计算机的不同之处在于，它们在传输信息时表现得更出色。所以这可能是它接受一次训练，就可以重复使用的技能——而不像人类，“复制”一个人的过程既耗时又不精确。

Q：不过，这种迁移学习的问题其实并不是真正的“AGI”问题。对吧？我们教会一台电脑识别猫的形象，给它看了很多猫的图片。但如果我们想教会它如何识别一只鸟，就必须重新开始，是这样吗？

Bryan Catanzaro： 我认为不是这样的。我认为，大多数时候，如果人们想要创建一个新的分类器，他们就会使用现有的分类器进行迁移学习，而这些分类器已经在各种不同的对象类型上进行了训练。其实这并不难做到，而且人们一直都成功地做到这一点。

所以至少在图像识别方面，我认为迁移学习很有效。对于其他类型的域名，可能会更有挑战性。但至少在图像识别方面，我们已经找到了一组更高级的功能，它们能够有效区分各种不同类型的物体，甚至是我们之前从未见过的物体。

我们能教会聊天机器人一些人类的规则么？

Q：我现在正在和你说话，同时我在咬我的手指。你继续听我讲话不会有任何问题，但这在电脑上会出一些问题。我们生活在地球上，做地球上生物所做的事情。但作为一般规则，我们如何把它传授给电脑呢？这与教它看什么、听什么一样吗？

Bryan Catanzaro： 我认为这很相似。高精度的语音识别系统基于大量的数据训练，而且似乎确实存在这样一种关系，即模型接受越多的数据训练，则准确度就越高。

我感到非常兴奋，计算机能够持续学习、理解音频，前景越来越好。然而，我想指出的是，“对话和交流”是人类的超级能力所在。人类有很多用于对话和理解交流语言的内置机制。讲话途径和听觉途径一起进化，所以它们能够完美匹配。

我记得我过去做过的一些关于语音识别的实验，识别性能对那些实际上是人类无法听到的压缩失真音频非常敏感。我们可以像这样录制一段录音，然后用一种听起来完全相同的方式压缩它，并且观察到我们模型识别准确率的显著差异。

这有点令人不安，因为我们试图训练模型，使其不受到人类不受影响变量的影响，但实际上很难做到这一点。我们当然还没有达到这个目标。我们一直在努力提高我们对所要解决的问题的理解，这样我们就能避免这些事情，但仍有更多的工作要做。

Q：当我面对聊天机器人或面对放在所有人桌面上的设备时，我不能大声地说话，因为他们会立即开始跟我说话，但我一直想问的问题是“什么东西更大，一个镍还是太阳？”到目前为止，还没有任何东西能够回答这个问题。它不知道太阳如何拼写。“那是谁的儿子？”太阳？镍？这其实是一枚硬币。”所有这些等等。为了让计算机回答这个问题，我们需要做些什么呢？

Bryan Catanzaro： 我认为其中的一个原因是，我们通常不会建立聊天系统来回答类似的问题。我认为，如果我们为这样的问题建立一个特殊用途的信息系统，回答这个问题就有可能。IBM沃森在《危险边缘》的表现相当不错，因为它接受的训练就是回答类似的问题。

我认为我们肯定有可以回答类似问题的数据库以及知识基础。问题是，这样的问题真的超出了大多数个人助理的领域，因为老实说，花絮非常有趣，但它们并不像可以设置定时器、查看天气或播放歌曲的机器人那样有用。所以这些都是那些系统所关注的事情。

除了围棋，人工智能还会在什么领域让人惊讶？

Q：人工智能在玩游戏方面做得非常好：深蓝、沃森、AlphaGo类似等等。我想这些都是有固定规则的受限环境，很容易理解谁赢了，什么是重点等等。接下来会发生什么？

Bryan Catanzaro： 我现在想到的是自动驾驶汽车。我认为它将改变世界，将人们从驾驶员的座位上解放出来。这将给人们带来巨大的灵活机动性。

这将改变房地产市场，因为我们不一定把车停在我们要去的地方。这将改变一些经济状，因为在经济上会有新的可行的交付机制。我认为智能可以帮助机器人在道路上行驶，这是我最感兴趣的下一件事，我认为它真的会改变一切。

Q：不过，AlphaGo在围棋上击败了Lee Sedol，这并不是一个令人惊讶的时刻。我想知道是否还有其他类似里程碑的东西呢？

Bryan Catanzaro： 我不知道。比如说，晚上我坐在车里面睡觉，而醒来它把我带到了迪斯尼乐园。我想要那种自动驾驶汽车，但那辆车还不存在。我认为自动驾驶卡车可以跨越国家运输货物，这将从根本上改变我们的物流方式。我认为，正如你所说的，我们已经走上了自动驾驶汽车的进化之路，人们会开始用它们来做一些让人觉得很有意义的事情。

就游戏和其他东西而言，电脑比人更擅长游戏，这很有趣，因为我觉得，硅谷思维有时候是一个非常线性的智力概念。一他们使用这种线性的智力，让一些人感觉受到人工智能的威胁，因为他们推断出人工智能在这个线性范围内变得越来越智能，这将导致各种各样的意外事件，比如Lee Sedol输掉了比赛。

智力是一种多维度的东西。事实上，电脑更擅长围棋这件事并没有对我的生活有多大改变。我不认为围棋是我智力的重要组成部分。当Gary Kasparov输给了深蓝，这并没有威胁到我的智慧。我在某种程度上定义了我的工作方式，以及我如何为这个世界增添价值，以及在很多其他的坐标轴上让我快乐的东西，但是除了“我可以下国际象棋吗？”之外。或者“我可以玩吗？”我认为这说明了智商确实是多方面的。有很多不同的种类——可能有成千上万种不同的智力——而且它不是线性的。

正因为如此，我觉得，当我们观注人工智能的发展时，我们会看到越来越多的智能机器，但它们在一些非常狭窄的领域会变得越来越智能，比如“这是比我更好的游戏机器人”，或者“这是比我更好的汽车司机”。这将是非常有用的，但它不会改变我对自己的看法、我的工作或者是什么让我快乐。

因为我觉得人类领域还有更多的智力维度将继续存在。这将需要很长一段时间，如果有的话，人工智能将会比我们在所有这些领域变得更好。因为，就像我说的，我不相信智力是线性的。

人工智能会让人们丢掉工作么？

Q：一般来说，关于自动化和人工智能对工作的影响有三种观点。会有一群人被认为是低技能的工人，会有自动化取代低技能的工作，而且会有相当一部分人被排除在劳动力市场之外。还有另一种观点说这将是一个转折点，它们可以做每一件事。它们会成为更好的指挥家、更好的画家、更好的小说家，以及比我们更好的东西。没有机器做不到的东西。还有第三种观点认为，在过去，即使我们拥有像电力和机械化这样的变革性技术，人们也会利用这些技术，提高自己的生产力，从而提高自己的收入。所以你永远不会因此而失业。你认同哪一个观点？

Bryan Catanzaro： 我觉得我更接近第三点，我很乐观。我相信，预期未来经济增长的主要方式是提高生产率。未来的人们应该比我们拥有更多的钱，因为他们的生产力更高，这就是我们应该期待世界经济继续增长的原因。因为我们发现了生产力是在不断提升的。

过去几十年，世界生产率增长一直在放缓，我觉得人工智能是我们摆脱这一陷阱的一种方式，在这种情况下，我们一直无法找到促进经济增长的方法，因为我们的生产率一直没有得到提高。实际上，我觉得这对我们所有人来说都是必要的，那就是找出提高生产率的方法，而我认为人工智能就是我们未来几十年需要做的事情。

在你的第三个说法中，我不同意的一件事是，失业率永远不会上升。我认为没有什么事情是那么简单的。实际上，我很担心短期内的工作转移。我认为会有一些人在受苦，事实上，在某种程度上，这种情况已经发生了。

特朗普的当选让我大开眼界：确实有很多人觉得自己被经济抛在了后面，他们对世界的看法和我的看法截然不同。我认为，随着我们我们社会数字化进程推进，人工智能成为一种杠杆，有些人会变得非常善于利用它来提高生产力，从而看到不平等加剧，这让我感到担忧。

我所担心是我们社会所面临的挑战，随着人工智能的兴起，我们必须做更多的事情以确保我们给人们生活的目的和意义，也许不一定是为了每天早上8点上班打卡。我想要相信这种未来的存在。

现在有很多人都是很优秀的人，他们可以很多不同的方式做出贡献，比如智力上的，艺术上的，但是他们现在没有机会，因为他们没有合适的机会接受正确的教育以运用他们的技能，而且他们中的很多人所从事的工作，我认为，并不能充分发挥他们的潜力。

所以我希望，随着我们将这些工作自动化进程的推进，能够让更多人找到为他们提供意义和目标的工作，让他们真正发挥自己的才能，让世界变得更美好，但我承认，此转变不容易。我确实认为，这将对我们的政府运作方式和经济运行方式产生重大影响，我希望我们能找到一种方法，帮助消除在过渡期间所经历的一些痛苦。

人工智能是否会被滥用？

Q：你是否担心人工智能的滥用？每当我们有新技术出现的时候，人们总是会看到其负面的形象。比如互联网这类东西，而且互联网在很大程度上一直起到了正面的作用。它以一种深刻的方式连接着人类。不胜枚举。而且当然，会有些人滥用它，你是否担心人工智能被非法利用，尤其是在战争中？

Bryan Catanzaro： 是啊。我确信会军队会制造一些可怕的杀手机器人。军队喜欢制造能灭口机器，人工智能将帮助他们做到这一点，这将是可怕的。有时候，我觉得利用恶意人工智能来对付人类所带来的威胁会比这更微妙。

在破坏某些对手的光纤系统之后，你可以做更多的事情，比如用人工智能来操纵它们。关于俄罗斯参与2016年美国大选的讨论很多，但与派遣邪恶的杀手机器人无关。其中更多的是改变人们的观点，或试图改变他们的观点，而人工智能将给实体组织以工具，使他们用一种前所未有的规模去实现。

我认为，其中不乏一些对人工智能的邪恶用途，它们比电影中所描绘的邪恶机器人杀手的全面正面攻击更难以察觉。我确实担心这些事情，但我也同意你的乐观观点。我认为人类犯了很多错误，我们此时不应该给太放松。

我们应该从这些错误中吸取教训，但同时我们也做了很多有益的事情。我们过去也曾利用技术让世界变得更好，同时，我希望人工智能也能实现这一点。

Q：假设你认为硬件是最大的驱动因素，那么你认为更大的进步是什么呢？是我们有了更多的数据，还是有更好的算法呢？

Bryan Catanzaro： 我认为最重要的是拥有更多数据。我认为，目前在人工智能领域使用的算法，或多或少都是已经存在了几十年的算法的智慧变种，过去这些算法都不奏效。

当我还是一名博士生的时候，我研究人工智能，所有聪明的人都告诉我：“不要学习深度学习，因为它并没有用处。使用另一种叫做支持向量机的算法。”在当时，希望那就是所谓的主算法。

所以我当时并没有研究深度学习，因为当时它的影响力很小。我认为现在我们有了更多的数据，而且深度学习模式能够成功地利用这些数据，因而我们已经取得了很大的进步。

不过，我并不认为深度学习是一种主算法，因为深度学习类似云的概念，内部结构交错，而实际上，从其中找到一个空间来解决特定的问题则需要很多人类的聪明才智。

英伟达目前面临什么样的挑战

Q：你是英伟达应用人工智能研究的负责人，那么你的一天是怎么度过的呢？你的团队在做什么？你现在面临的最大挑战是什么？

Bryan Catanzaro： 英伟达销售的图形处理器（GPU）支持了大部分的深度学习革命，因此，目前在全球范围内深度学习所进行的所有工作，都是在NVIDIA的 GPU上运行的。这对英伟达来说是非常激动人心的，我也很兴奋能参与到这个项目中来。

我认为，下一步，英伟达要想办法利用人工智能来改变自己的工作方式。英伟达之所以有动力这么做，是因为我们看到了人工智能给我们的客户所带来的价值。我们的GPU销售一直在增长，因为对于其他所有试图利用人工智能解决自身问题的人们来说，我们的产品极具价值。

我认为我们将看到人工智能以不同的方式应用于解决许多不同的问题，而我在英伟达的工作就是想办法做到这一点。所以这就是我的团队所关注的。

我们在几个不同的领域都有项目，从图形到音频，还有文本，等等。我们正试图改变英伟达的一切：从芯片设计到视频游戏，以及两者之间的一切。

在我的日常工作中，我领导着这个团队，这意味着我花了很多时间和团队里的人讨论他们所做的工作，并努力确保他们拥有适当的资源、数据，合适的硬件、想法和正确的逻辑，这样他们就能在试图解决的问题上取得进展。

然后，我们制作一些原型产品，展示如何将人工智能应用于特定问题，然后我与公司的同事合作，向他们展示人工智能应用于他们所关心问题的前景。

我认为，这项任务能让我感到非常兴奋，因为我们真的正站在公司的核心位置为改变英伟达公司而努力工作着。因此，我们并没有开发应用型人工智能，而可能会帮助搭建公司的一些外围设备。我们实际上是在努力解决该公司在人工智能领域面临的非常根本的问题，希望我们能够改变公司的运营方式，将英伟达转变为一家人工智能公司，而不仅仅是一家为人工智能制造硬件的公司。

Q：你会感到人才短缺吗？

Bryan Catanzaro： 我认为，无论你在哪家公司工作，整个行业都面临着缺乏合格科学家来进行人工智能研究的现象，尽管如此，每年进入人工智能领域的人数一直在增加。

如果你参加任何学术类人工智能会议，你会看到有很多精力充沛且充满兴奋的新面孔。能看到这个景象真是太好了。但即使面对这些增长和变化，对整个行业来说仍是一个大问题。所以，对于所有想知道下一步会发生什么的听众来说，来从事人工智能工作吧。我们有很多有趣的问题需要解决，但合适的人很少。

Q：总的来说，你认为人工智能做出的每一个决定都应该是可以被解释的吗？

Bryan Catanzaro： 我认为这有点乌托邦。当然，我没有能力解释我做出的所有决定，而人们通常不擅长解释他们所做的决定，这就是为什么对于实情会有重大的法律之争，人们看待问题的方式不同，并且以不同的方式记忆。所以让一个人解释他们的意图实际上是非常困难的，因为实际上我们并不是很擅长。

因而我认为我们并不能够强制人工智能以一种对人类有意义的方式来解释它所做出的所有决定。我坚信，我们可以做一些事情使系统的结果更具有解释性。例如，在我之前提到的简历工作描述匹配系统上，我们已经建立了一个原型，可以突出显示模型中对简历最感兴趣的部分，无论是正面的还是负面的内容都是如此。

这是向解释能力迈出的一小步，因此，如果你要把职位描述和某个特定的人拎出来，看他们是如何匹配的，可能就会向你解释这个模型在做排序时的关注点在哪儿。

科幻小说对人工智能的影响

Q：最后谈谈这个问题：你看科幻小说吗？你曾经看过类似的电影或其他的书吗？如果是这样的话，你会看到描绘人工智能的任何东西，比如Ex Machina，或者 Her，或者韦斯特世界等其他任何类似的东西，你会看到会说，“哇，这真的很有趣，”或者“那可能会发生”，或者“太有意思了”之类的东西吗？

Bryan Catanzaro： 我确实喜欢科幻小说。我喜欢科幻小说。我真的觉得现在的科幻小说与我对人工智能的理解是不一致的。例如，（Ex Machina）是一部有趣的电影。我很喜欢看那部电影，但从科学的角度来看，我觉得其并不是很有趣。我所说的是我们对世界的固有认识模式。

几千年来，人类一直在思考的一个问题是，“有人想要找你。”我们很大一部分的潜意识在担心，比如“今晚谁会来杀我？”谁会抢走我的工作？谁来拿走我的食物？谁会把我的房子烧掉？这些都是我们担心的事情。因此，科幻小说对人工智能的大量描述，是对大脑担忧未来的放大化，而并不是真正地与科技及其潜在对话。

我认为，科幻小说中，最影响我对人工智能看法的是阿西莫夫机器人三大定律（Isaac Asimov’s Three Laws）。我认为，这些作品都是非常经典的，我希望其中一些作品能够改编以针对我们如今试图用人工智能所解决的问题，从而使人工智能变得安全，并让人们有信心与人工智能互动，而不是担心人工智能的发展。

但我觉得大多数科幻小说都是这样，尤其是电影，其增加卖点的结果是使人们感到害怕，而不是向人们展示人工智能正在帮助人们过上更好的生活。事实上并不像电影那么吸引人，所以我觉得流行文化对人工智能的处理是非常不现实的。