玩游戏有助学习?认真脸的人工智能
图片来源:MOJANG。
基本可以确定,未来某一天你会坐上无人驾驶车。当那一天到来,或许控制你方向盘的人工智能也已经可以愉快地玩起Minecraft了。
听起来很神,但是要教会学习算法——推动未来高级人工智能的动力——如何理解和在三维空间内导航,类似Minecraft之类的开放世界游戏是一级棒的工具。实现这一步,对创造可以与真实世界进行复杂互动的人工智能,是非常重大的一步。
电子游戏经常被认为是逃避现实的无脑行为,但是因为游戏里带来如此大量的信息——想想看Minecraft里面玩家创造的扩展性世界——他们尤其适合给AI当做教材,教会他们如何感知世界并与之互动。“找个人来教AI很难,”Xerox的研究员Adrian Gaidon说,因为它们“在真实世界里还不如个婴儿,你得什么事情都给它们解释。”
到某一阶段后,人类完全没有这个时间和耐心。而电子游戏则没有这个问题。你可能对它们不耐烦,但是它们对人绝不会不耐烦。
把AI给骗了
通常,被称作“深度学习”的算法,作为现代人工智能的基础,研究员训练它们的方式是给它们填鸭大量的数据。这些系统把数据吞下,从中找寻模式。如果你想教类似AlphaGo的AI下围棋,你把所有能找到的围棋棋谱都喂给它吃。棋类游戏中,这是最简单的一部分。即便是最难的棋类游戏中的阴谋诡计,在计算机看来也不难,AlphaGo可以从几百万大小的样本库中学习。
但是对于更复杂的任务,例如说,开汽车,收集足够的信息在物流和财务上的挑战都太大了。谷歌进行了不计其数的无人车试验,用各种原型收集了几百万英里路程,完善控制汽车的AI。对于不如谷歌和百度这么土豪的公司, 在有限的资源下,这种方法对研究员来说是不可行的。这让电子游戏越来越有吸引力。 在游戏世界,你可以相对划算且快速地收集到大量信息。
18个月前,Adrien Gaidon看见最新版《刺客教条》的预告片,他忽然灵机一动。“我很震惊,因为我以为这是一个电影的预告片,而这实际上是CGI。我有20秒钟都被骗了。这是我第一次。”
他思考, 如果现代游戏可以轻松骗到我,也许他们也可以去骗骗AI。 所以他和Xerox的团队开始用电子游戏引擎Unity,给深度学习 神经网络 输入类似汽车、马路和人行道等图片,让它学会识别真实世界中的这些物体。
研究员已经有过成功案例。谷歌AI在学会下围棋前,还学会了Atari游戏。其他AI项目还学会过《超级马里奥》等级的游戏。不过,使用游戏引擎做三维渲染,以及在这些空间内训练AI,带来了只有最近才变得可能的复杂程度。
“游戏引擎的真正好处是,你制造像素的时候也知道这些像素对应的是什么,”Gaidon说,“你不只是制造像素,你也在制造AI所需的指导。”
目前为止,Gaidon说他在Xerox的工作非常成功:“我现在想展示的是,这项技术已经足够成熟,可以用计算机里的数据来训练其他计算机软件。”
嵌入在Minecraft中
微软同样也看到了这其中的价值。公司最近宣布,下半年会发布Malmo项目,一个可以“让计算机科学家用Minecraft设计AI实验”的开源平台。在其复杂度和开放度之外,Minecraft提供了AI实验的新方法,Malmo项目的研究负责人Katja Hoffman说。
“你玩Minecraft的时候,你实际在这个复杂的3D世界里,”Hoffman说,“你从你的感官输入里感知到世界,你的交互方式包括通过走来走去、放置模块、建造东西还有跟其他人物互动。这种充满刺激的性质, 与我们和真实世界的交互方式相似。 ”
Hoffman和团队希望,他们的工具可以将研究推向比Gaidon团队更加激进的方向。在类似Malmo项目中学到的技能,她相信可以让AI不仅学会在Minecraft中走动,并且学会在我们的真实世界中行动。“我们认为这是个非常基础的AI研究项目,我们希望大致理解,个体如何与周围环境互动、并理解周围环境。”她说,“ 在真实世界和限制更多的游戏之间,Minecraft是一个完美的中间点。 ”
然而,从模拟到现实的转变是非常复杂的。游戏中的模拟通常不像真实人类一样行动,而且游戏世界是为了简单易懂而造的,并不是为了百分百复制真实世界。另外,任何个体,人类或其他的,如何建造出对空间现实的认知,目前仍然是一个谜。
“如何开发出,对环境能建构出有意义的内在表征的智能个体, 我们在这条路上还处于非常早期的阶段。 ”Hoffman说,“对人类来说,我们好像整合了我们所有的各种感官。我想,关联各种信息来源,是一个非常有趣的研究挑战。”
“感知机器的幻觉”
当科学家终于搞明白AI如何能建构某个环境的内部表征,它的形式也许会出乎人们的意料。这种形式有可能是前所未见的。“这也许和我们大脑中实际的情况非常不同。”Hoffman说。
这应该没那么出人意料。人们想飞,但是真的飞起来的方式,与鸟儿飞行的方式完全不同。“我们受到鸟和昆虫的飞行方式启发。但真正重要的是,我们理解实际的机制,例如如果创造正确的压力,或者把物体从地面飞起来的正确速度。”
对于AI也一样。计算机感知世界的方式已经是与人类完全不同。举个例子,最近伦敦的ScanLAB项目让我们知道了,无人车的激光扫描“眼”如何看这个城市。结果非常奇异,幽灵与破碎图像的“平行景观”, 城市景观交织在“感知机器的错觉与幻觉“中。
同样的,谷歌最近的例子证明, AlphaGo是以人类理解不了的方式去理解古老的围棋。
那么,下一代“感知机器”眼中的世界又是什么样的呢?通过虚拟空间算法建造出来的模型、方法和技术——把它们应用到我们的城市、公园和家里,它们会看见什么呢?我们在以更有力的方法教会AI理解世界。电子游戏可以帮助机器实现这种理解。但是,当这种理解实现的时候,到时我们也许就已经看不懂了。
via Wired