AlphaGo逆转李世石：机器本性战胜人性弱点

DoNews-互联网 • 9年前扫码分享

腾讯科技雷建平 3月10日报道

3月10日，人机世纪大战迎来第二场较量，这场较量注定会备受瞩目。

在此前的3月9日，人机世纪大战第一场结果出乎大多数人的意料，谷歌人工智能系统AlphaGo竟然在局势不利的情况下，挑战世界围棋冠军李世石成功，李世石则投子认输。

很多人认为李世石故意放水，李世石则在随后的发布会中表示，“比赛中有两件事让我吃惊，一个是AlphaGo开局下得非常好，第二个是在比赛过程中不断有一些令我想不到的下法。”

李世石说，“我没想到过我会输。我觉得我一开始犯的那个失误一直伴随到了最后，成了我失利最主要的原因”。

创新工场CEO李开复则在这场比赛棋至中盘时就点出李世石的问题：李世石在尝试新打法，这非常不明智。比较好的打法是按照经典标准，以过去专家打法来，会比铤而走险更稳当。

围棋九段、中国国家队著名国手江铸久指出，从李世石布局阶段就能看出来，他今天在心理上一开始就有波动，因为他采取的是非正常的布局。这也说明AlphaGo这5个月进步很快。

李世石败给AlphaGo的背后，是人性与机器的较量。分析称，真正让人感到害怕的不是AlphaGo的棋力，而是它的没有情绪、不知疲倦、沉着冷静。这与AI无关，是机器的本性。

求稳让李世石犯下致命错误

这场谷歌AlphaGo对抗世界围棋冠军李世石的较量，从一开始就像一场在刀锋上的比赛。

开局之初，AlphaGo与李世石的对攻就显得惊心动魄，一度AlphaGo还处于领先位置，不过，在“开战”2个小时后，李世石的优势逐渐开始明显，AlphaGo陷入到劣势。

古力九段点评说，从今天来看，AlphaGo围棋水平比欧洲冠军樊麾要强，已经具备职业强手的素质，但在细节方面刚好离专业差一点。AlphaGo应该是处于业余六七段的水平。

AlphaGo最凶险的时候，古力九段和柯洁九段已做出预测，这一盘棋，AlphaGo基本上输了，“如果是个人类选手，基本上已经可以投子认输。”

在巨大的劣势中，AlphaGo突然又开始抗争，最后反而越战越勇，后发而至，与李世石又形成僵持局面，甚至占有优势。李世石面临的局势又变得非常凶险。

而赢面非常大的情况下，李世石过于求稳，反而被AlphaGo追上，且出现明显失误，损失三目棋。现场解说员表示，AlphaGo与李世石这一番厮杀，他都受不了了。

AlphaGo逆转李世石：机器本性战胜人性弱点

一直到下午3点30分，李世石投子认输。在这场长达3个半小时的对抗赛中，AlphaGo赢得最终胜利，李世石情绪、体力、心理波动等人性弱点对棋局结果的影响不可低估。

一位围棋界人士点评说，李世石并不输在棋力，而是输在获得优势以后的轻敌，以及之后所犯的错误。尽管AlphaGo也曾出现失误，但在李世石遭遇的失误面前这些失误可忽略不计。

相比AlphaGo，李世石更聪明、棋力更深厚，但AlphaGo的优点是，情绪控制更好，它不会紧张，不会嘚瑟，不会沮丧，也不会体力下降。AlphaGo更像是一位棋力比他稍差的忍者。

实际上，围棋手和围棋手之间的较量，围棋手与机器之间的较量有很大的不同。

两个人下棋的时候，棋手常常会观察和琢磨对方情感和心理。对方是紧张了，害怕了，你在想象对方的同时，这种作用对方也会感到到，折射回来。但和机器下棋，这个就显得很别扭。

更可怕的是，AlphaGo有很强的学习能力，基本没套路可寻。欧洲围棋冠军樊麾曾对腾讯科技表示，面对机器就像面对一堵墙，所有感觉全部都被打了回来，机器却没有心态的波动。

克服人性弱点是战胜AlphaGo的关键

资料显示，AlphaGo使用蒙特卡洛树搜索算法，借助值网络与策略网络这两种深度神经网络，通过值网络来评估大量选点，并通过策略网络选择落点。

机器最初通过模仿人类玩家，尝试匹配职业棋手的棋局，一旦它达到了一定的熟练程度，它开始和自己对弈大量棋局，使用强化学习进一步改善它。

作为一个大数据专家，陈利人认为，人类不可能不犯错，而机器不会犯错。棋局中说到的机器犯错，是人类理解的犯错，而这些选择，是机器精确计算后的结果。

陈利人说，最后我们看到的局部战斗，机器的绝对优势发挥淋漓尽致。人类经常只能看势，模糊估算。但机器在小的搜索空间，完全可以精确计算，找出最优的选择。

“机器下出的不符合通常人类认可的模式，给人类造成了很大的困扰。人类在没有模式可follow的情况下，尝试新的下法，出错（失算）的概率很大，也有可能造成心理的负担。”

尽管李世石输掉了首场比赛，但此次人机世纪大战一共分为5场，还有4场，分别是3月10日、3月12日、3月13日和3月15日。依然有很多人对李世石获得胜利很有信心。

资深研究员戴文渊认为，和AlphaGo对抗时人类需要注意几点：

1，AlphaGo所基于的人工智能技术，强项不在于推演，而是借鉴过去见过的局面。所以，如果要击败AlphaGo，需要尽可能把局面导向历史上没人下过的棋。

2，围棋的边角战斗靠计算，中空战斗靠感觉。既然感觉占优，那就一定要尽量把胜负手留在棋盘中间。靠做“势”取胜，而不是把战火引到边角实地。

3，一旦进入到局部缠斗，尽早将局部肉搏战打完，不要留出大量小区域短兵相接的局面，保持局面尽可能大开大合。

此外，需要格外小心的是，一定要克服自己人性的弱点。局面领先时，避免骄傲；落后时，避免气馁；胶着时，避免紧张。

戴文渊认为，李世石如果能在后面几局注意控制自己的心魔，依然可以扳回不利的局面。

古力九段认为，这盘棋在细微的地方机器跟人还是有区别，AlphaGo要吃亏一些，但李世石也存在很大的失误，就是在战局的右边，当形势一片大好的时候，人出现了松懈。

“由于前面有乐观心态，他连自己最擅长的拼搏都没有了，而是选择安乐的输棋，这让我们对他今天的发挥比较失望。这次失败也会对他敲了警钟，我对他第二场的发挥比较期待。”

尽管输掉比赛，李世石在随后也表示，经过第一场比赛，觉得第二场比赛的胜负会是五五开。

在这场谷歌AlphaGo对抗世界围棋冠军李世石之后，一场新的较量或许也在酝酿。第一场赛后，李世石的对手柯洁发微博表示，“就算阿法狗战胜了李世石，但它赢不了我。”

尽管是1997年出身，但柯洁在2015年世界大赛已豪取三冠，与李世石的交往战绩是8胜2负。不久前刚结束的农心杯三国擂台赛上，柯洁作为主将还力克李世石助中国队捧杯。

谷歌AlphaGo似乎也将目标标准了中国棋手，准备在挑战李世石后，再展开一场较量。AlphaGo围棋创始人哈萨比斯称，希望AlphaGo能与中国的高水平棋手对弈，比如柯洁。

“其实我觉得这次棋谁赢谁输不是最重要的。”李开复说，一旦AlphaGo达到专业二段的水平以后，打败人类只是迟早的事，这个时间点可能最快只要6个月到2年的时间就能到来。