围棋之后，谷歌AI为什么向《星际争霸》游戏宣战

网易科技 • 7年前扫码分享

本文系网易智能工作室（公众号 smartman 163）出品。聚焦AI，读懂下一个大时代！

【网易智能讯 8月10日消息】井字棋，跳棋，象棋，围棋，扑克。人工智能像无情的潮水一样席卷了每一场比赛。现在，谷歌的DeepMind又在瞄准一款关于宇宙战争的多人游戏“星际争霸2”。

没人指望机器人能在短时间内赢得比赛。

但是，万一机器真的获胜，那可比赢得围棋的成就大得多，并不仅仅是因为星际争霸是是一款专业电子竞技，每个月的累计观看量能达到数百万小时。

DeepMind和暴雪刚刚发布了一款工具，使得AI研究人员制造出能够在银河战争中与人类竞争的机器人。机器人能够看到和完成所有人类玩家可以做的所有事情，仅此而已。但是他们不会被优待。

DeepMind和暴雪还将从过去65000场的星际争霸2游戏中获取大量数据，这些数据对机器人的开发至关重要，而且还以每月50万场的速度递增。

DeepMind一份新的报告，其中包括将星际争霸的数据提供给学习软件的早期结果，显示出机器要完全掌握该游戏方式还有很长的路要走。但是，谷歌并不是唯一一家对重视星际争霸的大公司。周一晚些时候，Facebook发布了星际争霸65000场人人对战的原始数据，来帮助机器人开发者。

然而，投入这么大血本绝不单单是为了乐趣。谷歌表示，它将利用DeepMind的机器学习技术，削减公司数据中心的冷却费用。掌握星际争霸可以让软件承担更复杂、更有利可图的工作。“从科学的角度来看，星际争霸与现实生活的属性非常相似，”纽芬兰纪念大学的教授大卫丘吉尔说。他曾为DeepMind提供有关星际争霸工具的指导，也曾组织过星际争霸机器人竞赛。“我们正在为现实中使用的技术做一项测试。”

研究人员使用非官方的开源插件，多年来为星际争霸的原始版本制作了机器人。丘吉尔教授说，到目前为止，这些机器人水平一般，他们主要依靠的是设计师的战术，来建立自己对游戏的掌控，而并非机器学习。

向星际争霸宣战显示了谷歌和Facebook的野心，也显示了当今最智能软件的局限性。 星际争霸是一款即时战略游戏，玩家可以在遥远的银河系角落指挥一支外星军队。虽然这款游戏看起来不像围棋或象棋那么令人望而生畏，但它向人工智能提出了更大的挑战。在象棋和围棋中，你可以看到对手的所有动作和棋子，是所谓的完全信息的博弈。而星际争霸是一款不完全信息博弈的游戏。你无法看到对手所有的部队部署或建设项目，这迫使你不得不采用自己所见以及思维模式，来预测他们可能的计划。除此之外，星际机器人也不能太依赖超人类能力，快速地处理各种可能性。

围棋棋局中有效位置的数目是1，后面跟着170个零。研究人员估计，想要达到星际争霸的复杂性，后面需要至少再增加100个零。

“这是一个很大的进步，”研究星际争霸的DeepMind研究员Oriol Vinyals说。“这款游戏将要求我们在规划、记忆以及如何应对不确定性方面进行创新。”

打败星际争霸需要做出很多突破。简单地把当前的机器学习算法指向过去游戏的新阶段，来模仿人类是不够的。“电脑将需要开发出适合自己长处的游戏风格，比如在多任务处理方面，”Martin Rooijackers说，他制造了领先的星际争霸玩家LetaBot。他说：“机器人玩星际争霸的方式与人类的方式不同。”

毕竟，莱特兄弟并没有通过模仿鸟来让机器飞起来。丘吉尔猜测，“星际争霸”机器人要打败人类还需要5年时间。（选自：Wired 作者：Tom Simonite 编译：网易见外智能编译平台审校：jixinyue8871）

关注网易智能公众号（smartman163），获取人工智能行业最新报告。