扑克人机大战,人类胜算只有10%?

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

(原标题:扑克人机大战,人类胜算只有10%?)

本报记者 操秀英

AI风暴再次来袭。6日开始,卡内基梅隆大学知名扑克机器人Libratus将化身“冷扑大师”,与中国“龙之队”在海南展开为期5天、长达45小时的扑克人机大战。主办方在5日的赛前发布会上宣布,获胜一方将获得200万元表演赛奖励。

“冷扑大师”是卡内基梅隆大学开发的无限德州扑克人工智能系统。今年1月,它击败了人类顶尖玩家。在这次比赛中,每当这些玩家发出一个动作,它就会被传送到卡内基梅隆大学的计算机服务器上。

中国“龙之队”华人顶尖牌手由2016年世界扑克大赛金手链冠军得主杜悦领军。杜悦估计,虽然“冷扑大师”是目前扑克界最强的人工智能,但人类顶尖牌手仍有10%的胜率。

创新工场CEO暨人工智能工程院院长李开复之所以发起这场扑克人机对战,和他1988年在母校卡内基梅隆大学开发“奥赛罗”的经历息息相关,后者成为第一个击败黑白棋世界冠军的人机对弈系统。

“德州扑克是创投圈人士爱玩的一项活动,AI更是创投圈近年来关注的重点,这次活动对AI的宣传和推动将起到重要作用。”赛事协办方春光里运营总监董冬则告诉科技日报记者。“我当然希望人类能赢,但‘冷扑大师’毕竟曾打败过美国顶尖的德扑选手。”董冬说。

人工智能专家一直将这些游戏作为开发和测试的工具,在此之前,计算机已经在国际象棋、西洋双陆棋中击败了人类,去年的AlphaGo更是名声大噪。“扑克则有些不同,因为你不知道你的对手拿的是什么牌。”作为德州扑克爱好者,董冬分析。

谈到与围棋比赛、AlphaGo的不同,李开复表示,德州扑克更接近人性,因为信息是有隐藏的,牌手可以诚实或欺骗地表达。这些种种的推敲,更像是人与人之间的商业、外交博弈,“冷扑大师”的技术都与这些因素相关。

通过对手的动作表情判断对手牌的强弱,是德州扑克相当重要的一种游戏技巧,而“冷扑大师”作为一个冷冰冰的人工智能系统,如何应对人类棋手复杂的心理战呢?

对此,李开复表示,对于“冷扑大师”来说,心理战其实是基于一个优化结果最大化的一个计算,它计算该怎样去做才能得到最多的积分牌。他说,扑克机器人的研发基于博弈论,并且结合了大量的数学和概率理论,扑克程序在赛前不曾研拟历史牌谱,直接在比赛同时动态优化胜率最高的数学模型,利用战略推理揭露玩家底牌的隐藏信息,从而建构出智能化的AI谈判策略套路。在技术研发的背后,其实电脑并不对人类玩家的心理战术进行任何模拟或分析,反倒以博弈论加上大量数学打败了顶尖牌手。

卡内基梅隆大学计算机学院院长安得烈・穆尔教授则认为,“冷扑大师”表面呈现的是扑克,背后实际是一个大型的谈判算法。扑克AI并没有用到神经网络和机器学习这两种技术,而是用了比较古典的线性规划。

李开复认为,现今这套人工智能扑克程序背后的模型,将适用于需要用到战略推理和多方谈判的场景。从企业谈判、商务谈判、外交谈判、甚至到生活方面的房屋买卖谈判,10年内都将会部分或全面被人工智能所取代。

随意打赏

ios 10 人机界面指南德州扑克人机大战李世石人机大战围棋人机大战德州扑克人机人机大战
提交建议
微信扫一扫,分享给好友吧。