OpenAI狂虐Dota大神Dendi，AI称霸游戏界这事你咋看

网易科技 • 7年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

本文系网易智能工作室（公众号smartman 163）出品。聚焦AI，读懂下一个大时代！

【网易智能讯 8月14日消息】上周五晚，埃隆・马斯克的OpenAI团队在电子竞技领域一鸣惊人，跃居成为世界上最伟大的选手之一。

据悉，在上周五Dota 2国际邀请赛上，Open AI的机器人在Dota2 1v1比赛中战胜了Dota人类顶级职业玩家Dendi。至此，继横扫人类国际象棋大师和围棋大师后，人工智能如今又将风靡全球的电子竞技游戏Dota2攻陷。

比赛期间，Open AI公司的机器人表现是非常“强悍”的，不仅会 卡兵、 s补刀， 还会 s掉技能抬手 ，其进攻性超强，连续两局狂虐Dendi。如此“强悍”的Open AI机器人手法娴熟， 出手“快”、“准”、“狠”，刀刀毙命 ，这不禁令Dendi求饶：“请放过我吧。”

针对此战情，马斯克很快就欢呼着发了推文，庆贺胜利。他写道：“OpenAI在竞争激烈的电子竞技领域中首次击败了世界上最优秀的选手。Dota 2比传统的棋类游戏复杂得多。”马斯克暗指自己的OpenAI机器人比AlphaGo更胜一筹。尽管OpenAI这款机器人绝对是了不起的――它展示了一种对职业玩家的统治地位，但机器人并不会取代Dendi在团队中的位置。

什么是Dota2？

OpenAI狂虐Dota大神Dendi，AI称霸游戏界这事你咋看

《DOTA 2》是一款由Valve开发免费的多人在线战斗竞技类游戏，其前身是魔兽争霸三及扩展版本冰封王座中的一张自定义游戏地图。截至目前，Dota2是steam平台上活跃人数最多的游戏之一，最高在线人数超过120万。Dota2的游戏比赛在两个队伍间进行，每个队伍有五名玩家，每个队伍都有一条优势路。每个队伍的游戏目标是摧毁对面要塞中的远古遗迹。每个玩家从113位能力风格技能迥异的英雄中选择一位进行操控。在比赛中，玩家在相互对抗的过程中为各自的英雄收集金钱、经验及道具。

双方玩家将在一幅地图上争夺地盘，杀死对方小兵和电脑控制的其他游戏单位，以增强他们的力量，并试图杀死对方以给自身队伍带来益处。这些角色的特技不同，比如进攻、防守和支持，但是复杂多变的因素意味着人类棋手在几十种不同的风格、策略和角色中都只能扮演一个英雄。

战况回顾

OpenAI狂虐Dota大神Dendi，AI称霸游戏界这事你咋看

然而，在1v1的模式中，两位玩家都被分配到同一个英雄――暗影恶魔（简称“影魔”），一个广受欢迎的进攻性英雄，被许多世界上最好的中路角色玩家所青睐。胜利的规则很简单――杀死对方两次或摧毁一座防御塔的玩家则获胜。“影魔”并不是Dendi玩的最好的英雄，但他仍然是这个角色的顶级玩家。本周早些时候，OpenAI报道称，他们的机器人击败了目前的1v1冠军Sumail（美籍巴基斯坦游戏玩家，曾获得过DOTA2第五届国际邀请赛冠军），以及世界上最好的中路玩家――Arteezy。

在这种格局的游戏中，OpenAI的机器人完全占据了主导地位。双方交锋过程中，在第一场比赛期间，主持人问Dendi：“你感觉它像一个‘人类选手’吗？”Dendi回答说：“不，这家伙真的很可怕。”他不停地说着，面对机器人放狠招，他还一度大叫“请放过我吧！”第一局比赛中，第一局Open AI机器人仅用10分钟就击败了Dendi（Dendi试图杀死机器人的同时，机器人杀死了他二次）。第二场比赛中，机器人在开场的几分钟内无情地痛打了他一顿，他便投降了主动放弃了比赛,并拒绝进行第三场比赛。

OpenAI的这款机器人频繁展示高超的战术，阻止较小的单位，引诱着Dendi进入陷阱，并积极地采用战略并利用它来惩罚Dendi。之前，Dota 2的计算机控制算法可以与人类选手相抗衡，但它们的编程却相对初级。在某种程度上，大多数专业人士都足够优秀，能够找到机器人游戏风格的策略和弱点，这样他们就可以轻松地开发和击败机器人。但是，这次的OpenAI机器人在上场之后几乎找不到弱点。

机器人构建

OpenAI机器人运行了一种改良版的机器学习算法，这意味着它会随着它的运行而进化和学习，并抛弃其代码的低级版本（该公司并没有具体地使用它的语言，但据一名程序员透露，这是一种遗传算法）。该机器人学会了玩游戏，不过这个游戏是要打败它自己。OpenAI Dota 2团队的负责人Greg Brockman说，在早期阶段，决斗的暗影恶魔只是在地图上毫无目的地四处乱跑直到他们死去，但慢慢地，他们学会了一些策略，让他们更接近设定的获胜目标。几周之后，他们就变得十分强大，足以击败专业选手。“这款机器人可以从零开始，在两周的时间内变得很强大，”他说。

“自我博弈”（self-play）是OpenAI研发的关键所在。据悉，这是一种用于学习和解决机器复杂任务的有效方法：与太强或者太弱的都手过招，它都无法从中学到任何东西，但是可以将自身作为竞争对手。这次的机器人完全是在自我博弈下进行针对训练的，并没有使用模仿学习或树搜索。

未来5V5不是“梦”

OpenAI挑战Dota 2背后的故事（来源：网易科技频道）

据悉，Dota 1v1是含有隐藏信息的复杂游戏，智能体需要通过学习计划、进攻策略，并从中学会误导对手。玩家技巧和手速的关联性也不那么强烈了。而实际上，OpenAI的手速一般，和普通人类玩家大致相当。而要想在Dota中取胜，要求玩家培养出敏锐的直觉，并采取相应的应对措施。视频中，我们可以看到，该机器人已经通过自我博弈学会了预测其他选手的动作，并在不熟悉的场景下即兴发挥，刀刀毙命。面对Dota繁琐复杂的游戏规则，该机器人并没有丝毫的“怯场”，应用自如。在训练之初，AI对于自己的所处的世界一无所知，从零开始学习，进行自我博弈，这其实意味着它和它的对手永远旗鼓相当，并不断取得进步，进而达到职业选手的水平。

当然，1v1模式的Dota并不是真正的Dota。但这是一个次要问题，就像棒球里的全垒打一样。你可以制造一个俯仰的机器人，它可以一直扔出完美的快速球，但是，要想建立一个机器人棒球运动员团队是完全不同的事。无论是在编程方面，还是在最高级别的协调、沟通和战略方面，都面临着严峻的挑战。在完整的5v5版本游戏中，有成千上万的不定因素，那远比精简版的多很多――所以马斯克的胜利之声是在混淆实际的成就。不过，OpenAI并没有就此止步。该公司表示，“下一步是创建一个Dota 2机器人团队，这些机器人可以与顶尖的人类团队进行竞争和协作”。这意味着，如果它采用同样令人印象深刻的技术，明年的TI8可能会有一个完整的机器人挑战者团队。

真实的世界

Dota全球大赛上，Dendi挑战OpenAI记录（来源：网易科技频道）

当然，这其中的含义是，能够掌握复杂视频游戏的机器人也可以有其他的用途。“我们所建立的是一个普遍的学习系统，尽管它在很多方面仍然受到限制，但它仍然能击败最优秀的人类专家，”Brockman说，“这是朝着向建立更通用的系统迈出的关键一步，它可以学习真正复杂的、重要的现实世界里的任务，比如做一名外科医生。”

向来以建设安全可靠的通用人工智能为己任的OpenAI，通过“自我博弈（Self-Play）”从零开始训练这款电子竞技机器人。赛前，Open AI CTO Brockman对外透露了该款机器人在Open AI的指导下经历了一千次比赛的训练。Brockman 还声称这个 bot 已经打败多个世界级职业玩家。接下来，该公司表示将要转战研究5V5，未来战胜人类世界级玩家不是“梦”。

OpenAI是我们工作的公司，其目标是确保这些强大的系统对我们所有人都是有益的。这也是马斯克计划的一部分。他的想法是，最终人工智能将比人类更聪明，而且人工智能必须在安全、受监管的情况下进行。“没有人喜欢受到监管，但所有对公众构成威胁的东西（汽车、飞机、食品、药品等）都必须要受到监管。人工智能也应该是这样的。”上周五晚，马斯克发表推文说道。

人工智能目前可能不会对社会造成多大威胁，但在Dota2的比赛中，它确实很可怕。（选自：Inverse 编译：网易见外智能编译平台校对：田俊宏）

随意打赏

openai universe openai dota2 openai dota openai