德扑人机对战结束：人类完败，输了79万分

钛媒体 • 8年前扫码分享

钛媒体注：由创新工场李开复发起的德扑人机大战，今天（4月10号）上午正式结束。在5天比赛里，中国龙之队全部输给了人工智能“冷扑大师”，输掉792327分，堪称惨败。

在前4天比赛里，中国龙之队和冷扑大师共交战8场次，累计33000手牌。8个场次里，中国龙之队分别输掉14145分、50992分、186842分、160723分、173936分、59938分、42744分、55664分，累计输掉744984分。今天上午，中国龙之队再次输掉47343分，保持着连续惨败的势头。

德扑人机对战结束：人类完败，输了79万分

比赛的结局并不出乎意料，由于之前有过AlphaGo战胜人类棋手的前车之鉴，网友对于人类选手普遍有着悲观的预测，李开复也曾经表示“对人类能赢感到悲观，赢的概率不到10%”。

事实上今年的1月份，在宾夕法尼亚州匹兹堡的Rivers赌场，CMU开发的 Libratus 人工智能系统就曾击败过人类顶级职业扑克玩家，那场比赛共持续了20天对玩了12万手，最终AI赢得了176万美元。

此次对战的双方，机器人团队是 “冷扑大师”，它是由卡内基梅隆大学（CMU）Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus无限德州扑克人工智能系统；人类团队是“中国龙之队”，是由杜悦领军，成员包含了许朝军、张淮、童舟、朱亚希、王天建等顶级高手，而杜悦曾在2016年的世界德州扑克大赛WSOP的无限注德州扑克赛事中获得冠军。

AlphaGo与李世石的人机对战，让人工智能在垂直领域中的能力彻底展现了出来。但是此次参与比赛的Libratus 与其又有着不同之处。

从技术上来讲，扑克的游戏规则更像是在处理真实世界的问题。在围棋、象棋等游戏中，机器和人类在决策前可以获得全部信息。而在德州扑克中，并不知道对手与自己的手牌，这就存在着更多的不确定性。一般来讲，德州扑克要求参与比赛的团队需要学会“使诈”。

Libratus使用的策略并非基于专业玩家的经验，没有涉及到深度学习技术，而是依靠大量的数学。基于在匹兹堡超级计算机中心大约 1500 万核心小时的计算，它使用算法分析德州扑克规则，从而建立自己的策略，而且它能够在比赛中，通过预测所有未来步骤的胜率来思考自己的下一步。

“如果AlphaGo是一个超级天才，冷扑大师CMU系统其实一定程度上是一个EQ专家，是靠EQ来打败你。”李开复这样形容它，

AI利用增强学习技术，从自我对局中学习最优的扑克玩法，而避免从人类的既定模式中学习经验，这是非常重要的一点。”

不过，Libratus的算法现在也只适用于一对一的比赛，如果常见的多人比赛，那么算法策略上还需要进行升级与调整。

而且与AlphaGo一样，虽然它们都在一个垂直的领域中打败了人类代表，但是对于解决更为现实、更多广泛的问题上，并没有多少延展的能力。

人工智能如何发挥自己的商业价值？

这不仅仅是AlphaGo与冷扑大师所面临的问题，而是整个人工智能领域所需要解决的事情。在李开复看来，这需要满足三个条件：海量的数据、数据有标注、单领域。例如在金融领域，金融是虚拟的由人创造的，数据量庞大且天生带有标注。

李开复在比赛结束后讲，“人工智能已从完美信息的AlphaGo，延伸到了不完美信息的冷扑大师，人机对战基本没有悬念了，据闻AlphaGo近期即将来华和柯杰对战，其实已经不再具有科学意义了，以后更应该关注商业领域的人工智能，在金融、医疗、教育等领域产生的商业价值。”

从实验室，到与人类对战测试，到现实场景的应用，这样的一条路径在现在讲求“效率”的社会上，可能有一点点慢。但是未来人工智能的广泛应用，则是已经被诸多商业、媒体与技术大佬们所认可的么？

此外，在今天下午还有一场“名人赛”，是以李开复博士为首的创投、科技、娱乐圈各路大咖将组成六组战队，分别与冷扑大师一较高下。

这场比赛，也许结果更容易猜测出来。

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App

随意打赏

德扑人机大战德扑人机人机对战