马斯克的 OpenAI 单挑 Dota 世界冠军,人类 10 分钟惨败
Dendi 输了。
如果你玩过 Dota 2,那你多少会对这个名字有点印象。这位出生于 1989 年的乌克兰男孩,是世界上最顶尖的电竞选手之一,曾随队在第一届 Dota 2 国际邀请赛上(The International DOTA2 Championships,简称 Ti)获得冠军,又在后面两届 Ti 斩获亚军。
8 月 11 日,万众瞩目的 Ti7 当日正式比赛落下帷幕,之后上演的是一场表演赛。第一位登场的选手是 Dendi,而他的对手是一个 U 盘,里面装着由 OpenAI 开发的 Dota AI。
(Dota 选手 Dendi,图片来源: liquipedia )
OpenAI 是由特斯拉 CEO 埃隆·马斯克成立的一家非营利公司,旨在开发更安全的 AI 技术,预防人工智能带来的危害。目前,OpenAI 的全职员工已经超过 50 人。 在赛前的宣传片里 ,OpenAI 开发的 Dota AI 已经打败了现役的 Arteezy、SumaiL 等世界冠军。
人机大战一触即发。
(黑人小哥手中的 U 盘就是参赛 AI)
规则不是常见的 5V5,而是 Solo 单挑。不能使用瓶子、凝魂之泪、灵魂之戒、神坛等道具,双方都使用影魔(Shadow Fiend)。通过制定这些规则,大大减少了战场的变量、计算量,更彰显出选手的操作硬实力。
Dendi 曾经是最强的中单选手之一,但谁也没想到,短短 10 分钟,他就败下阵来。
一开局,OpenAI 就展现出堪称完美的卡兵技巧。卡兵,是 Dota 中的一种技术手段,可以让游戏刷出的第一波兵更接近已方的防御塔,从而在对线期时可以获得更大的优势。
等到双方开始交锋时,Dendi 与 OpenAI 的差距开始明显地显现出来。无论是补兵还是对点攻击,AI 对距离和时机都把握都更加准确,毫无迟疑。根据 OpenAI 官方给出的数据,AI 每分钟的操作次数(APM)仅仅是人类的平均水准,换言之,AI 的每次出手收益都比 Dendi 更高,无效操作更少。
最让人讶异的是,AI 在比赛过程中居然做出了漏补刀的假动作,故意诱骗 Dendi 上前补刀,然后击杀他!以致于 Dendi 在比赛中无奈地抱怨:
求不虐……
第二局依旧是同样的结果,AI 完虐人类。
比赛结束后,OpenAI 的老板马斯克还不忘在 Twitter 上嘚瑟一下:
OpenAI 第一次在电竞上完胜世界顶级选手,这可比象棋围棋复杂多了。
(图片来源: Twitter )
尽管这场赛事存在诸多限制,1v1 的复杂性与 5v5 也不在一个量级,但 OpenAI 的胜利至少说明,在电竞领域,人工智能的进步比我们想象的还要快。
与其他人工智能算法稍有不同的是,OpenAI 并没有通过模仿学习和树搜索策略来进行训练,而是完全通过 「自我对决」(Self-Play) 的方式来提升自己的水平。在这个过程中,AI 从最早随机浑噩的状态逐渐进化到世界冠军级的单挑水准,仅仅花费了两周的时间。
众所周知,一场完整的 Dota 比赛战况是复杂而又难以预料的。由两支队伍进行对决,共有 10 名选手,英雄数量多达上百名,装备更是数不胜数,玩家可以从中做出各种选择——而 OpenAI 的下一个目标,就是组建一支能够与世界冠军们匹敌的 AI 队伍。
有了 AlphaGo 的先例,相信这个目标离我们不会太远。
题图来源: The Verge