冷扑大师狂虐中国龙之队 李开复:人机对弈无悬念
雷帝网 乐天 4月10日报道
“冷扑大师V.S.中国龙之队—人机扑克巅峰表演赛”10日中午刚刚完成的最后一局赛程,冷扑大师最终以792,327总记分牌的战绩获胜,此次表演赛的200万奖励归属冷扑大师。
此次人机扑克大战巅峰表演赛的发起人、创新工场CEO、人工智能工程院院长李开复博士表示:透过冷扑大师和龙之队表演赛的对战结果,人机对战基本没有悬念了。
“据闻AlphaGo近期即将来华和柯洁对战,其实已经不再具有科学意义了。”
AI处理人机对弈的信息模式可大致分为完美信息、不完美信息两类,人机棋牌对弈中的围棋和扑克正是这两类的代表,AI经过这两类赛事胜过人类已获得验证。
这次来到中国的冷扑大师V.S.中国龙之队的人机扑克巅峰表演赛,是和李开复博士母校、全球计算机及人工智能领域顶尖的卡内基梅隆大学携手合作。
李开复说,“下一阶段我更关注的是,AI真正进入到我们的生活和商业领域会引发的一连串大地震”。
人工智能领域不再是几个小伙伴打天下的时代
中国龙之队队长杜悦在谈到五天比赛感想时表示,“人工智能在对战时不会受到情感、心理、体能等因素影响,且强大运算能力远超人类大脑,冷扑大师很多手牌打得令人拍案叫绝”。
冷扑大师发明人、卡内基梅隆大学Tuomas Sandholm教授解密AI德扑背后的技术奥秘:扑克在几十年来一直是人工智能和博弈论中的一个具有高挑战性的问题。
作为带着隐藏底牌的“不完美信息”游戏,扑克对AI来说,具有国际象棋和围棋游戏中未曾出现的信息障碍。
今年一月,人工智能Libratus在有超过10 ^ 160个决策点的单挑无限德州扑克比赛中打败六位顶尖专业牌手获得认可,这次“冷扑大师”对阵六位强大的中国牌手,积累了优势。
Libratus和冷扑大师在三个主要技术模块中都使用了新的算法:包括比赛前采用近于纳什均衡策略的计算(Nash Equilibrium strategies)、每手牌中运用终结解决方案(Endgame Solving)、及根据对手能被识别和利用的漏洞,持续优化战略打得更为趋近平衡。
这个算法模型不限扑克,可以应用在各个真实生活和商业应用领域,应对各种需要解决不完美信息的战略性推理场景。
冷扑大师相对于AlphaGo高明之处在于冷扑大师不需要提前背会大量棋谱,也不局限于在公开的完美信息场景中进行运算,而是从零开始,基于扑克游戏规则针对游戏中对手劣势进行自我学习,并通过博弈论来衡量和选取最优策略。
这也是冷扑大师在后程越来越凶悍,让人类玩家难以抵挡的原因之一。
对此创新工场李开复博士说,人工智能发展势不可挡,未来的人工智能领域不再是几个小伙伴就可以打天下的时代了,而是需要顶尖的人工智能科学家、海量数据、强大的运算能力、以及清晰行业应用几大闭环。
李开复称,希望冷扑大师对战龙之队这场人工智能的里程碑事件将推动人们对于人工智能的认知。“人机扑克对战中,我们看到了在尔虞我诈、概率不确定、非完美信息需要推理和情商的游戏里,机器一样可以获胜,而类似的场景在真实世界中比比皆是。”
人工智能已经不再只和AlphaGo对标,人工智能已从不完美信息的处理,进步到对不完美信息海量信息运算,并具备了推理和学习能力。
李开复强调,“我期待下一个更加高明的AI大师级应用登场,而我更愿意相信,这些应用会来自优秀的年轻创业者,而不是诸如BAT等的科技巨头黑洞”。
—————————————————
雷帝触网由资深媒体人雷建平创办,其为头条签约作者,若转载请写明来源。