围棋之后,谷歌AI为什么向《星际争霸》游戏宣战

围棋之后,谷歌AI为什么向《星际争霸》游戏宣战

本文系网易智能工作室(公众号 smartman 163)出品。聚焦AI,读懂下一个大时代!  

【网易智能讯 8月10日消息】井字棋,跳棋,象棋,围棋,扑克。人工智能像无情的潮水一样席卷了每一场比赛。现在,谷歌的DeepMind又在瞄准一款关于宇宙战争的多人游戏“星际争霸2”。

没人指望机器人能在短时间内赢得比赛。

但是,万一机器真的获胜,那可比赢得围棋的成就大得多,并不仅仅是因为星际争霸是是一款专业电子竞技,每个月的累计观看量能达到数百万小时。

DeepMind和暴雪刚刚发布了一款工具,使得AI研究人员制造出能够在银河战争中与人类竞争的机器人。机器人能够看到和完成所有人类玩家可以做的所有事情,仅此而已。但是他们不会被优待。

DeepMind和暴雪还将从过去65000场的星际争霸2游戏中获取大量数据,这些数据对机器人的开发至关重要,而且还以每月50万场的速度递增。

DeepMind一份新的报告,其中包括将星际争霸的数据提供给学习软件的早期结果,显示出机器要完全掌握该游戏方式还有很长的路要走。但是,谷歌并不是唯一一家对重视星际争霸的大公司。周一晚些时候,Facebook发布了星际争霸65000场人人对战的原始数据,来帮助机器人开发者。

然而,投入这么大血本绝不单单是为了乐趣。谷歌表示,它将利用DeepMind的机器学习技术,削减公司数据中心的冷却费用。掌握星际争霸可以让软件承担更复杂、更有利可图的工作。“从科学的角度来看,星际争霸与现实生活的属性非常相似,”纽芬兰纪念大学的教授大卫丘吉尔说。他曾为DeepMind提供有关星际争霸工具的指导,也曾组织过星际争霸机器人竞赛。“我们正在为现实中使用的技术做一项测试。”

研究人员使用非官方的开源插件,多年来为星际争霸的原始版本制作了机器人。丘吉尔教授说,到目前为止,这些机器人水平一般,他们主要依靠的是设计师的战术,来建立自己对游戏的掌控,而并非机器学习。

向星际争霸宣战显示了谷歌和Facebook的野心,也显示了当今最智能软件的局限性。 星际争霸是一款即时战略游戏,玩家可以在遥远的银河系角落指挥一支外星军队。虽然这款游戏看起来不像围棋或象棋那么令人望而生畏,但它向人工智能提出了更大的挑战。在象棋和围棋中,你可以看到对手的所有动作和棋子,是所谓的完全信息的博弈。而星际争霸是一款不完全信息博弈的游戏。你无法看到对手所有的部队部署或建设项目,这迫使你不得不采用自己所见以及思维模式,来预测他们可能的计划。除此之外,星际机器人也不能太依赖超人类能力,快速地处理各种可能性。

围棋棋局中有效位置的数目是1,后面跟着170个零。研究人员估计,想要达到星际争霸的复杂性,后面需要至少再增加100个零。

“这是一个很大的进步,”研究星际争霸的DeepMind研究员Oriol Vinyals说。“这款游戏将要求我们在规划、记忆以及如何应对不确定性方面进行创新。”

打败星际争霸需要做出很多突破。简单地把当前的机器学习算法指向过去游戏的新阶段,来模仿人类是不够的。“电脑将需要开发出适合自己长处的游戏风格,比如在多任务处理方面,”Martin Rooijackers说,他制造了领先的星际争霸玩家LetaBot。他说:“机器人玩星际争霸的方式与人类的方式不同。”

毕竟,莱特兄弟并没有通过模仿鸟来让机器飞起来。丘吉尔猜测,“星际争霸”机器人要打败人类还需要5年时间。(选自:Wired 作者:Tom Simonite 编译:网易见外智能编译平台 审校:jixinyue8871)

关注网易智能公众号(smartman163),获取人工智能行业最新报告。

随意打赏

围棋ai alphago谷歌围棋alphago星际争霸人工智能谷歌人工智能围棋谷歌围棋人机大战星际争霸重制版谷歌ai围棋谷歌智能围棋谷歌围棋大战星际争霸2
提交建议
微信扫一扫,分享给好友吧。