德扑人机大战AI狂虐龙之队,九场完胜共赢79万分
今天中午, “冷扑大师V.S.中国龙之队——人机扑克巅峰表演赛”落下帷幕。
这场关于德州扑克的“人机大战”由李开复发起,对战双方一方由由六位华人顶尖扑克选手组建,队长杜悦曾在世界德州扑克大赛WSOP的无限注德州扑克赛事中获得冠军。
另一方是美国卡内基梅隆大学托马斯•桑德霍姆教授开发的Libratus(“冷扑大师”)。Libratus在今年1月11日至1月30日一对一无限注德州扑克比赛中,曾击败四名顶尖人类高手。
比赛前,李开复就曾预言,人类代表队的胜算也只有10%。而面对今天中午的最终结果,李开复也表示:“透过冷扑大师和龙之队表演赛的对战结果,人机对战基本没有悬念了,据闻AlphaGo近期即将来华和柯洁对战,其实已经不再具有科学意义了。”
在此次比赛和1月匹兹堡的两次德扑人机对战中,Libratus和冷扑大师在三个主要技术模块中都使用了新的算法:包括比赛前采用近于纳什均衡策略的计算(Nash Equilibrium strategies)、每手牌中运用终结解决方案(Endgame Solving)、以及根据对手能被识别和利用的漏洞,持续优化战略打得更为趋近平衡。
这也是冷扑大师在后程越来越凶悍,让人类玩家难以抵挡的原因之一。在五天的巅峰表演赛中,冷扑大师和中国龙之队双方共完成了36,000手牌,每天鏖战10个小时。
在谈到五天的比赛感想时,中国龙之队队长杜悦说,“ 人工智能 在对战时不会受到情感、心理、体能等因素影响,且强大运算能力远超人类大脑,不得不承认冷扑大师很多手牌打得令人拍案叫绝”。
李开复也坦言,“我认为,未来的人工智能领域不再是几个小伙伴就可以打天下的时代了,而是需要顶尖的人工智能科学家、海量数据、强大的运算能力、以及清晰行业应用几大闭环。”
事实上,围棋和德州扑克代表了AI处理人机对弈的两种信息模式——完美信息和不完美信息。在博弈论中,完美信息指后参与者可观察到前参与者的行为。不完美信息指参与者做选择的时候不知道其他参与者的选择。
不同于AlphaGo,Libratus不需要提前背会大量棋谱,也不局限于在公开的完美信息场景中进行运算,而是从零开始,基于扑克游戏规则针对游戏中对手劣势进行自我学习,并通过博弈论来衡量和选取最优策略。
因此,李开复也表示,冷扑大师对战龙之队这场人工智能的里程碑事件将推动人们对于人工智能的认知。
人机扑克对战中,我们看到了在尔虞我诈、概率不确定、非完美信息需要推理和情商的游戏里,机器一样可以获胜,而类似的场景在真实世界中比比皆是。人工智能已经不再只和AlphaGo对标,人工智能已从不完美信息的处理,进步到对不完美信息海量信息运算,并具备了推理和学习能力。
他强调,“我期待下一个更加高明的AI大师级应用登场,而我更愿意相信,这些应用会来自优秀的年轻创业者,而不是诸如BAT等的科技巨头黑洞”。
解码人工智能·猎云网2017产业创新峰会 4月13日北京等你参加: http://www.lieyunwang.com/topic/summitai
296131