人工智能与人类挑战《星际争霸2》,到底有什么意义?
【AI世代编者按】 科技 网站Ars Technica近日撰文称,暴雪与谷歌(微博)DeepMind的合作虽然并未在暴雪嘉年华上吸引广泛关注,但这个项目却有着极其深远的意义。
以下为原文内容:
2016年暴雪嘉年华(BlizzCon 2016)上反响最不强烈的一项声明,恰恰有可能最具革命性。
当天,《炉石传说》、《风暴英雄》、《守望先锋》和《暗黑破坏神3》引得台下的暴雪粉丝阵阵欢呼,但谷歌DeepMind将与这家《星际争霸2》的开发商共同促进人工智能研发的消息却只是来了人们的低声抱怨。
热情不足或许源自兴趣缺乏。毕竟,《星际争霸2》的玩家凭什么对人工智能科学家的计划感兴趣呢?然而,倘若DeepMind与暴雪之间的合作能够达到开发者的预期,玩家也将从中获得实际利益——甚至连很多视频 游戏 领域之外的人也将获益。
一段时间以来,人工智能已经成为视频游戏中不可分割的一部分。正如《星际争霸2》制作总监克里斯·斯嘉蒂(CHris Sigaty)所说,DeepMind的产品并非暴雪即时战略游戏的第一个人工智能“玩家”。
各种游戏目前使用的都是脚本化的人工智能程序,这些程序的设计师和工程师都了解游戏的运行方式,他们将自己的能力植入到脚本中,然后向程序传授一系列场景。例如,如果收集到X数量的资源,人工智能就应该在Z部队上花费Y数量的价值。
“这些程序制作得都很详细,与他们对战都很有意思:有一些随机的选择,还有一些明确选择。”斯嘉蒂说,“他们可以拓展疆域,收集资源——这都是你需要在《星际争霸2》里做的事情。但这些人工智能程序都是脚本化的。它们的行为可以预测,所以除非作弊,否则这些人工智能程序无法击败人类。”
事实也的确如此,最优秀的《星际争霸2》电子竞技选手经常击败人工智能。DeepMind的目标是开发一种能像人类一样玩游戏的人工智能程序,甚至有可能击败最优秀的人类玩家,从而拓宽深度学习技术的潜力。
DeepMind团队已经在游戏领域取得了一些成功:该团队的人工智能程序AlphaGo今年3月以4:1的比分击败了世界顶尖围棋选手李世石,一举跨过了人工智能以往最大的障碍。
不只是游戏
DeepMind研究员奥里奥尔·温亚尔斯(Oriol Vinyals)表示,《星际争霸2》可以帮助人工智能取得重大进步,因为这款游戏里的元素不是静态的,而且没有采用回合制,所以有助于为人工智能开发创造基准。
“我们认为,《星际争霸2》的复杂度让我们现在可以测试几年前无法处理的算法。”他说。
在《星际争霸2》里,玩家取得成功所需的很多信息最初都是隐藏的,所以需要侦查不同的地方,同时还要管理资源,组建部队,以便探知对手的状况。
静态人工智能将屏幕上的活动视作一个个的数据包,而DeepMind想要把《星际争霸2》作为一种学习体验,就需要隐藏这些数据——这一点跟人类玩家基本相同。
“这一过程更加复杂,因为这款游戏隐藏了部队,而玩家也不知道敌人在哪里。他的重点是规划和资源管理,玩家还要考虑他们之前是否与对手有过对抗,以及如何利用这一知识接近对手。”温亚尔斯说。
“这些都是人工智能面临的艰巨挑战,我们需要在新的环境中处理这些问题。关键在于,即使无法在短期内获得成功,也可以开始构建一个人工智能基准,一步步地推进这项技术。另外,对外开放之后,所有人都可以贡献自己的想法,帮助我们改进流程。”
暴雪与DeepMind之间的合作并非闭门造车。温亚尔斯在暴雪嘉年华上表示,《星际争霸2》的人工智能研究环境将向所有开发者、业余爱好者以及希望参与其中的玩家开放。
DeepMind向全球发出号召,因为他们需要整个世界帮助其克服这一重大挑战。API计划于2017年第一季度以游戏补丁的方式发布,并将作为免费的Starter Edition的一部分提供给玩家。但正如温亚尔斯所说,在正式发布前仍有很多工作要做。
“合作最近刚刚启动。”他说,“第一步是建立环境,让我们可以将人工智能程序植入其中,使之可以在玩游戏的过程中进行观察。我们正在集中所有精力来建造这一环境,因为我们必须向公众发布这个环境。这必须成为其他人工智能研究人员的基准。有很多人在研究人工智能,所以确保他们都能使用这一环境是非常重要的。”
“下一步是推出这个程序,我们目前只进行了简单处理。”
学习过程
“这是一场艰巨的挑战。”斯嘉蒂说,“必须解决一些重大的问题。对深度学习而言,必须有一套系统,可以使之获得一个与人类看到的内容相似的学习环境。”
一旦建立了这样的系统,便可将人工智能引入其中,然后开始学习。为了完成闭环,DeepMind还需要确保人工智能能够在这个环境中观察和采取行动。
虽然这种闭环的基本结构以前也曾使用过,但《星际争霸2》却可以更加深入地挖掘深度学习的潜力。相比于在雅达利游戏机上左右晃动手柄或者识别19×19的围棋棋盘,这种技术将实现巨大的进步。
“在此之前,你可以从你所关注的游戏中获取数据流,无论是人类玩家与人工智能对战,还是人类玩家之间的对战都可以。”斯嘉蒂说。通过这种方式,即可了解游戏中的各种运行规则和模式。
“我们正在开发和即将推出的API无法看到这些数据,因为它并没有进行探索。它把游戏里的数据当做一种视觉格式,于是,一个会学习的人工智能程序可以吸收这些信息,并开始像人类一样玩游戏。”他说,“这之所以令人兴奋,是因为我们接下来讨论的是神经网络和深度学习。我们并不知道结果会是什么。”
如果取得成功,DeepMind和暴雪都将从中获益。从游戏角度来看,暴雪可以将该项目视作一种改进《星际争霸2》使用体验的方式,抛弃可以预测的脚本化人工智能,提供对发行商及其玩家都更有吸引力的新技术。
“我们希望开发出一套没有预先设定的程序,可以通过观察人类玩家的玩法不断学习——即便它可能无法达到人类玩家的水平,但仍然可以为玩家提供与以往不同的且变化多端的新挑战。”斯嘉蒂说。
这种深度学习有望向人工智能揭开运行模式、常见错误、胜利条件的神秘面纱,还可以揭示出究竟到什么时候,一个玩家注定会胜利,另外一个玩家注定会失败。
“最终可以判断某个做法究竟是好是坏——但我们现在还无法判断何时才能实现这一目标。”斯嘉蒂说,“这样就能开发出一个教练,告诉玩家‘现在建造这个部队比较好’。它还可以为正在学习的玩家提供建议,告诉他们哪些人不会知道某些游戏技巧。”
电子竞技
斯嘉蒂表示,如果真的能够实现这种水平,就可以解决暴雪及其玩家面临的一些地域问题。电子竞技观察者都发现一个现状:韩国玩家在各类比赛中占据主导,而部分原因在于他们的家庭环境允许其与世界顶尖选手对抗。这一点在《星际争霸2》中体现得尤为明显。其他地方的玩家很少有机会与才华横溢的对手对抗,因此提升的潜力也很有限。
“如果这项技术取得成功,玩家水平的提升就不会受到地域的限制,而最顶尖的选手也可以改进自己的水平。”斯嘉蒂说,“一旦超过某个门槛,就会释放很大潜力。
温亚尔斯认为,使用人工智能的确可以达到这样的潜力,因为游戏领域之外的很多技术问题都非常相似。使用游戏帮助人工智能程序学习如何采取最佳行动是非常明智的,这可以模拟变量众多的复杂环境。
“一方面,我们可以同时利用多个数据中心监控许多游戏,测试许多想法。”他说,“这都可以用游戏分数来衡量——这样一来,我们就可以尝试着改进算法。一旦我们认为达到了某种突破,便可以将这些工具应用于现实。”
作为人工智能影响现实世界的最新实例,谷歌今年7月披露,DeepMind人工更智能技术帮助该公司将数据中心的电费降低了40%。人工智能已经可以融入学习环境,并大幅改进系统用电模式。
虽然谷歌通过可再生能源为数据中心供电的计划尚未落实,但DeepMind已经向降低能耗和成本的方向迈出了一大步。
“这跟游戏很相似。”温亚尔斯说,“人工智能程序会观察房间不同位置的温度,然后采取优化措施冷却数据中心。最终的方案比这更加复杂:既要减少开支,又不能破坏服务器。但有很多拥有游戏经验的并行程序,因为人工智能程序/环境范式很强大,也很通用。”
“游戏可以更快地测试和改进算法开发过程。一旦你提取数据,就可以看到更广泛的应用。无论从开发还是研究的角度来看,这都是人工智能的好时候。”
虽然听起来有些奇怪,但暴雪与DeepMind的合作只是《星际争霸2》非凡历史上的最新节点。该系列游戏的第一版主要是为了应对电子竞技的崛起。由于该游戏在韩国广泛流行,也在一定程度上刺激该国 投资 建设 互联网 基础设施。
如今,该游戏又在人工智能的发展过程中扮演了重要角色。这种进步确实令斯嘉蒂感到意外,他从第一代游戏开始就一直任职于《星际争霸》团队。
那么,《星际争霸》接下来又会向什么方向发展?
“我不知道!”他笑道,“或许是在宇宙飞船里玩游戏。我也要去!”
【来源: AI世代 】