让人工智能玩《星际争霸2》,这帮缔造 Alpha Go 的人到底在想什么?
2016暴雪嘉年华上有许多新消息。在那其中,最具革命性的消息反而最冷场。
《炉石传说》、《风暴英雄》、《守望先锋》和《暗黑破坏神3》的新内容收获了暴雪迷的欢呼。然而,当暴雪宣布《 星际争霸2 》的开发团队将和谷歌DeepMind共同开展AI研究时,观众的反应非常平淡,只有一些小声的嘟囔。
( 译注:DeepMind是最强的 人工智能 公司之一,战胜李世石的 Alpha Go 就是他们的产品。AI,Artificial Intelligence的简写,意为 人工智能 ,本文会根据需要混用“AI”和“ 人工智能 ”。 )
也许观众的态度有些令人扫兴,但其实很容易理解:星际玩家为什么要对人工智能科学家的计划感兴趣?
进一步说,如果DeepMind和暴雪的这项研究成功了,星际玩家也得不到任何好处——从此以后最高水平的星际竞技就和人类没关系了。
长久以来,人工智能始终是游戏的组成部分。《 星际争霸2 》的执行制作人克里斯·西嘉德就指出,DeepMind希望开发的AI肯定不会是第一个玩暴雪RTS游戏的AI,因为《星际争霸》系列自带脚本AI。这些AI由游戏设计师和工程师共同开发,他们将之间对游戏的理解注入到脚本中。这些脚本是由“条件”驱动的。例如,假如满足“资源收集量达到X”条件,AI就会花费Y的资源,去购买Z单位。
“那些AI很精致,和它们对打也挺有趣。它们可以做一些随机和特殊的选择,可以根据地形发展,采集资源——你能做的事它们基本都能做。不过,那些AI的本质是脚本,它们是可预测并且有限的。除非它们作弊,否则不可能战胜人类玩家。”( 译 注:这里表达的意思当然是“有一定水平的人类玩家”。)
图为DeepMind团队科学家温亚尔斯
奥里奥尔·温亚尔斯是DeepMind团队的科学家之一。他认为,《星际争霸2》可能帮助人工智能研究前进一大步。像《星际争霸2》这种非静态、非回合制的游戏,对人工智能来说是一个更好的参照体系。
“我们认为,《星际争霸2》的复杂性能让我们测试一些新算法。在几年前,我们还没有准备好对付这些算法,现在是时候了。”他说。
为了赢下一局《星际争霸2》,玩家需要很多信息,而这些信息大多是隐藏的。玩家需要一边采矿,一边造建筑,一边探路。普通AI(即常见的脚本AI)可以通过数据直接获取信息,DeepMind则希望它们的AI能够用人类玩游戏的方式,挖掘出游戏中隐藏的信息。
“这是个复杂的过程。在游戏开局,玩家甚至不知道敌人在哪。他们需要运营,需要回想是否和这个对手打过,并利用这些经验打败他。”温亚尔斯说。
“这对AI来说是非常艰难的挑战,但我们会适应这种新环境的。关键点在于,即使它没有马上成功,我们也可以通过研究过程来建立一个新的标准。这个标准会超越目前的最高水平。另外,项目是开放的,任何人都可以提出他们的意见。”
暴雪和DeepMind的合作不是封闭性的。在暴雪嘉年华的发布会上,温亚尔斯表示“《星际争霸2》AI研究项目”将对所有人工智能开发者,业余爱好者和玩家开放。DeepMind之所以把这个项目提升到“全球合作”的高度,是因为他们确实需要这么多人的智慧来完成如此艰巨的挑战。项目API将以补丁的形式于2017年第一季度发布,玩家可以在免费的初始版中进行使用。当然,温亚尔斯指出,距离补丁上线还有一定距离,大量工作有待完成。
AI眼中的《星际争霸2》是这样的
“我们的合作刚开始不久。第一步,我们需要建立测试环境。这个环境的作用是让AI一边玩一边观察。我们目前主要集中在这个环境上,因为它将对公众开放。并且,它还有可能成为其他人工智能研究者的参照体系。”
“第二步就是引入AI了。这一步的完成度还不高,我们只能在很初级的水准上完成。”
DeepMind需要确保AI能够在测试环境中观察并作出行动。这是深度学习的基本原理,但《星际争霸2》让它变得更复杂。《星际争霸2》的复杂度可比左右摇晃Atari摇杆,或者在19乘19的矩阵上放旗子要难得多。
“以往的AI可以直接获取游戏中的所有数据。我们希望AI直接面对游戏画面(而不是数据),它将用人类的方式玩游戏。我们之所以如此激动,是因为这代表着神经网络和深度学习的下一个阶段。我们并不知道结果会如何。”西嘉德说。
“我们在搞的东西可不是什么脚本。它通过观察人类玩家来进行学习。有一点是我们想做到但暂时没做到的:我们希望AI能判断出一个操作是好操作还是烂操作。我们甚至希望它可以成为人类的教练,告诉人类‘现在是造某单位的好时机’。”
西嘉德认为,AI可以解决《星际争霸2》目前面对的一些问题。《星际争霸2》项目被韩国人统治,其重要原因是韩国人在家门口就能和世界最强的选手对战,而其他地区的选手只能碰到数量有限的高手。AI能帮助改善这个现状。
“如果这个项目成功了,选手水平将不再受到地域因素的限制。”西嘉德表示。
也许有一天,AI会教人类打游戏
DeepMind认为,这个项目之所以有潜力,是因为项目中的难题具有普遍性。它们不光存在于这个项目里,还广泛存在于其他技术领域。AI在游戏中做出最佳选择,正是在模拟AI在现实世界中做出选择。
“我们将在这个项目的同时,平行使用多个数据中心进行其他游戏的模拟。我们的算法将不断进化,一旦我们认为它完成了某种突破,我们就可以开始让AI解决现实世界中的问题。”
其实,AI已经开始解决现实世界的问题了。最新例子是,DeepMind的AI接手谷歌数据中心的制冷系统,成功降低了40%的制冷费用。Google原本希望通过新能源来解决数据中心的能耗问题,但AI提供了全新的解决思路。
温亚尔斯说:“AI观察房间里不同位置的温度,从全局的角度做出最佳选择,降低数据中心的温度。当然,实际过程要复杂得多。我们希望在不损伤服务器的情况下,尽可能地降低能耗。这同游戏有些类似。‘AI/环境’模式非常强大,具有很强的普适性。”
“游戏帮助算法变得更快。一旦算法可以处理数据以外的对象,它就能产生飞跃,那对人工智能研究和开发来说会是一个伟大的时刻。”
那么,在温亚尔斯眼中,《星际争霸》的下一步在哪里呢?
“我不知道!”他大笑,“如果能在太空船里玩星际,我肯定会试试。”
译注:本文发表于11月23日,采访时间应该还要更早,所以我们才能看到西嘉德的谈笑风生。事实上,今年韩国星际竞技界出现了极为强烈的震动,多个老牌赛事停办,职业战队纷纷解散。截至11月23日,韩国职业星际战队仅剩下一支。
原文发表于 arstechnica ,作者为Nick Cowen,触乐编辑周思冲进行了编译。
查看原文