玩游戏有助学习？认真脸的人工智能

雷锋网 • 9年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

玩游戏有助学习？认真脸的人工智能

图片来源：MOJANG。

基本可以确定，未来某一天你会坐上无人驾驶车。当那一天到来，或许控制你方向盘的人工智能也已经可以愉快地玩起Minecraft了。

听起来很神，但是要教会学习算法——推动未来高级人工智能的动力——如何理解和在三维空间内导航，类似Minecraft之类的开放世界游戏是一级棒的工具。实现这一步，对创造可以与真实世界进行复杂互动的人工智能，是非常重大的一步。

电子游戏经常被认为是逃避现实的无脑行为，但是因为游戏里带来如此大量的信息——想想看Minecraft里面玩家创造的扩展性世界——他们尤其适合给AI当做教材，教会他们如何感知世界并与之互动。“找个人来教AI很难，”Xerox的研究员Adrian Gaidon说，因为它们“在真实世界里还不如个婴儿，你得什么事情都给它们解释。”

到某一阶段后，人类完全没有这个时间和耐心。而电子游戏则没有这个问题。你可能对它们不耐烦，但是它们对人绝不会不耐烦。

把AI给骗了

通常，被称作“深度学习”的算法，作为现代人工智能的基础，研究员训练它们的方式是给它们填鸭大量的数据。这些系统把数据吞下，从中找寻模式。如果你想教类似AlphaGo的AI下围棋，你把所有能找到的围棋棋谱都喂给它吃。棋类游戏中，这是最简单的一部分。即便是最难的棋类游戏中的阴谋诡计，在计算机看来也不难，AlphaGo可以从几百万大小的样本库中学习。

但是对于更复杂的任务，例如说，开汽车，收集足够的信息在物流和财务上的挑战都太大了。谷歌进行了不计其数的无人车试验，用各种原型收集了几百万英里路程，完善控制汽车的AI。对于不如谷歌和百度这么土豪的公司， 在有限的资源下，这种方法对研究员来说是不可行的。这让电子游戏越来越有吸引力。 在游戏世界，你可以相对划算且快速地收集到大量信息。

18个月前，Adrien Gaidon看见最新版《刺客教条》的预告片，他忽然灵机一动。“我很震惊，因为我以为这是一个电影的预告片，而这实际上是CGI。我有20秒钟都被骗了。这是我第一次。”

他思考， 如果现代游戏可以轻松骗到我，也许他们也可以去骗骗AI。 所以他和Xerox的团队开始用电子游戏引擎Unity，给深度学习神经网络输入类似汽车、马路和人行道等图片，让它学会识别真实世界中的这些物体。

研究员已经有过成功案例。谷歌AI在学会下围棋前，还学会了Atari游戏。其他AI项目还学会过《超级马里奥》等级的游戏。不过，使用游戏引擎做三维渲染，以及在这些空间内训练AI，带来了只有最近才变得可能的复杂程度。

“游戏引擎的真正好处是，你制造像素的时候也知道这些像素对应的是什么，”Gaidon说，“你不只是制造像素，你也在制造AI所需的指导。”

目前为止，Gaidon说他在Xerox的工作非常成功：“我现在想展示的是，这项技术已经足够成熟，可以用计算机里的数据来训练其他计算机软件。”

嵌入在Minecraft中

微软同样也看到了这其中的价值。公司最近宣布，下半年会发布Malmo项目，一个可以“让计算机科学家用Minecraft设计AI实验”的开源平台。在其复杂度和开放度之外，Minecraft提供了AI实验的新方法，Malmo项目的研究负责人Katja Hoffman说。

“你玩Minecraft的时候，你实际在这个复杂的3D世界里，”Hoffman说，“你从你的感官输入里感知到世界，你的交互方式包括通过走来走去、放置模块、建造东西还有跟其他人物互动。这种充满刺激的性质， 与我们和真实世界的交互方式相似。 ”

Hoffman和团队希望，他们的工具可以将研究推向比Gaidon团队更加激进的方向。在类似Malmo项目中学到的技能，她相信可以让AI不仅学会在Minecraft中走动，并且学会在我们的真实世界中行动。“我们认为这是个非常基础的AI研究项目，我们希望大致理解，个体如何与周围环境互动、并理解周围环境。”她说，“ 在真实世界和限制更多的游戏之间，Minecraft是一个完美的中间点。 ”

然而，从模拟到现实的转变是非常复杂的。游戏中的模拟通常不像真实人类一样行动，而且游戏世界是为了简单易懂而造的，并不是为了百分百复制真实世界。另外，任何个体，人类或其他的，如何建造出对空间现实的认知，目前仍然是一个谜。

“如何开发出，对环境能建构出有意义的内在表征的智能个体， 我们在这条路上还处于非常早期的阶段。 ”Hoffman说，“对人类来说，我们好像整合了我们所有的各种感官。我想，关联各种信息来源，是一个非常有趣的研究挑战。”

“感知机器的幻觉”

当科学家终于搞明白AI如何能建构某个环境的内部表征，它的形式也许会出乎人们的意料。这种形式有可能是前所未见的。“这也许和我们大脑中实际的情况非常不同。”Hoffman说。

这应该没那么出人意料。人们想飞，但是真的飞起来的方式，与鸟儿飞行的方式完全不同。“我们受到鸟和昆虫的飞行方式启发。但真正重要的是，我们理解实际的机制，例如如果创造正确的压力，或者把物体从地面飞起来的正确速度。”

对于AI也一样。计算机感知世界的方式已经是与人类完全不同。举个例子，最近伦敦的ScanLAB项目让我们知道了，无人车的激光扫描“眼”如何看这个城市。结果非常奇异，幽灵与破碎图像的“平行景观”， 城市景观交织在“感知机器的错觉与幻觉“中。

同样的，谷歌最近的例子证明， AlphaGo是以人类理解不了的方式去理解古老的围棋。

那么，下一代“感知机器”眼中的世界又是什么样的呢？通过虚拟空间算法建造出来的模型、方法和技术——把它们应用到我们的城市、公园和家里，它们会看见什么呢？我们在以更有力的方法教会AI理解世界。电子游戏可以帮助机器实现这种理解。但是，当这种理解实现的时候，到时我们也许就已经看不懂了。

via Wired