围棋之后,谷歌AI为什么向《星际争霸》游戏宣战
本文系网易智能工作室(公众号 smartman 163)出品。聚焦AI,读懂下一个大时代!
【网易智能讯 8月10日消息】井字棋,跳棋,象棋,围棋,扑克。人工智能像无情的潮水一样席卷了每一场比赛。现在,谷歌的DeepMind又在瞄准一款关于宇宙战争的多人游戏“星际争霸2”。
没人指望机器人能在短时间内赢得比赛。
但是,万一机器真的获胜,那可比赢得围棋的成就大得多,并不仅仅是因为星际争霸是是一款专业电子竞技,每个月的累计观看量能达到数百万小时。
DeepMind和暴雪刚刚发布了一款工具,使得AI研究人员制造出能够在银河战争中与人类竞争的机器人。机器人能够看到和完成所有人类玩家可以做的所有事情,仅此而已。但是他们不会被优待。
DeepMind和暴雪还将从过去65000场的星际争霸2游戏中获取大量数据,这些数据对机器人的开发至关重要,而且还以每月50万场的速度递增。
DeepMind一份新的报告,其中包括将星际争霸的数据提供给学习软件的早期结果,显示出机器要完全掌握该游戏方式还有很长的路要走。但是,谷歌并不是唯一一家对重视星际争霸的大公司。周一晚些时候,Facebook发布了星际争霸65000场人人对战的原始数据,来帮助机器人开发者。
然而,投入这么大血本绝不单单是为了乐趣。谷歌表示,它将利用DeepMind的机器学习技术,削减公司数据中心的冷却费用。掌握星际争霸可以让软件承担更复杂、更有利可图的工作。“从科学的角度来看,星际争霸与现实生活的属性非常相似,”纽芬兰纪念大学的教授大卫丘吉尔说。他曾为DeepMind提供有关星际争霸工具的指导,也曾组织过星际争霸机器人竞赛。“我们正在为现实中使用的技术做一项测试。”
研究人员使用非官方的开源插件,多年来为星际争霸的原始版本制作了机器人。丘吉尔教授说,到目前为止,这些机器人水平一般,他们主要依靠的是设计师的战术,来建立自己对游戏的掌控,而并非机器学习。
向星际争霸宣战显示了谷歌和Facebook的野心,也显示了当今最智能软件的局限性。 星际争霸是一款即时战略游戏,玩家可以在遥远的银河系角落指挥一支外星军队。虽然这款游戏看起来不像围棋或象棋那么令人望而生畏,但它向人工智能提出了更大的挑战。在象棋和围棋中,你可以看到对手的所有动作和棋子,是所谓的完全信息的博弈。而星际争霸是一款不完全信息博弈的游戏。你无法看到对手所有的部队部署或建设项目,这迫使你不得不采用自己所见以及思维模式,来预测他们可能的计划。除此之外,星际机器人也不能太依赖超人类能力,快速地处理各种可能性。
围棋棋局中有效位置的数目是1,后面跟着170个零。研究人员估计,想要达到星际争霸的复杂性,后面需要至少再增加100个零。
“这是一个很大的进步,”研究星际争霸的DeepMind研究员Oriol Vinyals说。“这款游戏将要求我们在规划、记忆以及如何应对不确定性方面进行创新。”
打败星际争霸需要做出很多突破。简单地把当前的机器学习算法指向过去游戏的新阶段,来模仿人类是不够的。“电脑将需要开发出适合自己长处的游戏风格,比如在多任务处理方面,”Martin Rooijackers说,他制造了领先的星际争霸玩家LetaBot。他说:“机器人玩星际争霸的方式与人类的方式不同。”
毕竟,莱特兄弟并没有通过模仿鸟来让机器飞起来。丘吉尔猜测,“星际争霸”机器人要打败人类还需要5年时间。(选自:Wired 作者:Tom Simonite 编译:网易见外智能编译平台 审校:jixinyue8871)
关注网易智能公众号(smartman163),获取人工智能行业最新报告。