DOTA2顶级玩家刚被击倒,DeepMind又开始向《星际争霸》下手了

猎云网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

想知道人类和AI系统如何能完美共存,我们可能需要杀死大波虫族。

Alphabet旗下的AI部门DeepMind,联手游戏公司暴雪公司,正发布一组工具,可以让程序员在太空主题游戏《星际争霸》中释放各种AI算法。

到目前为止,这款游戏比大多数AI程序接触过的游戏更具挑战性。星际争霸不仅极为复杂,而且需要长远规划,并尝试事后猜测你的对手下一步计划是什么。这就意味着开发能匹及人类的AI程序可以帮助研究员利用机器探索人类智能的信方面。据介绍,其他的一些潜在好处将是探索人类与AI程序合作的方式。

“星际争霸从许多方面来说都十分有趣,”主持该项研究项目的DeepMind研究员Oriol Vinyals说道。比如,玩家通常会时不时地一瞥对手活动,这意味着算法就需要开发更好的信息存储方式。“记忆至关重要,”Vinyals说,“你现在看到的并不是你刚才看到的,并且就在刚刚那一瞬间,也许会有特殊事件发生并影响你的下一步行动。”

DeepMind一向以开发各种精通不同类型游戏的AI程序而闻名。该公司以征服各类雅达利游戏为起点,最近又进军极为复杂和抽象的棋盘游戏Go。

为了掌握这些游戏,DeepMind的研究人员使用了一种被称为强化学习的机器学习技术。机器学习,是指让计算机知道如何在没有明确指示的情况下为自己谋划。强化学习,则是受动物的学习方式之启发,通过积极反馈实验来进行学习。但是,Vinyals说,将强化学习应用到《星际争霸》中将会更加困难,因为展开每场游戏都需要很长时间。

在星际争霸中,玩家可以选择三大族类之一加入游戏:与人类相似的Terrans族,机器人Protoss族,或者类昆虫Zerg族。战斗系统涉及复杂的战略行动,比如采矿资源和建造基地,以及旷日持久的战斗序列。《星际争霸》同时也是最受欢迎的观赏性电子竞技游戏,尤其是在韩国,锦标赛通常在大型体育场馆内进行并在电视上直播。优胜玩家将有机会与AI程序进行竞技,但是DeepMind暂未透露具体比赛时间。

由DeepMind和暴雪公司开发的工具将使得AI研究人员更加容易地在《星际争霸》游戏内部署和测试机器学习算法。这些工具将为AI程序提供与玩家所见相同的游戏和界面视图。它们还可以限制程序执行行动的速度。这可以确保程序不得不依赖于人类相当的智力工具。

《星际争霸》被用作研究平台已有一段时日,但相对来说难度较大。Vinyals本身是一名资深《星际争霸》玩家,还是加州大学伯克利分校的学生时,他已参与了为星际争霸开发聊天机器人的工作。Facebook和中国企业阿里巴巴的团队也各自发表了相关的《星际争霸》研究。DeepMind将在本周的主要机器学习会议上发布论文,演示现有算法在游戏中的表现。

然而,掌握类似《星际争霸》这样的游戏或许需要完全不同的方法。其他一些研究人员已经采用从游戏理论中获取的方法,成功在其他“不完善信息”的游戏中取得不小进展。今年早些时候,卡耐基梅隆大学教授托马斯·桑德霍姆和他的一个学生诺姆·布朗建立了一个名为Libratus的程序,该程序击败了数名职业选手。Libratus采用了极为复杂的算法来计算整个游戏中的最佳策略。且巧合的是,布朗今夏一直在DeepMind实习。

暴雪公司的原理工程师雅各布·瑞普表示,他的公司十分好奇复杂AI程序是否能够使得游戏变得更加有意思,无论是与人类对抗或与人类合作。在游戏中创建可跟随脚本指令进行行动的程序已经成为可能。瑞普说,让这些程序使用机器学习达到某一程度也十分令人期待。并且,他还说,公司正在探索更多的此类想法。“我们发现这些工具对游戏制作和功能设计都十分有帮助。”

随意打赏

deepmind alphagogoogle deepmind谷歌收购deepminddeepmind labdeepmind创始人deepmind 开源deepmind公司谷歌deepminddeepmind团队deepmind
提交建议
微信扫一扫,分享给好友吧。