AlphaGo逆转李世石:机器本性战胜人性弱点
腾讯科技 雷建平 3月10日报道
3月10日,人机世纪大战迎来第二场较量,这场较量注定会备受瞩目。
在此前的3月9日,人机世纪大战第一场结果出乎大多数人的意料,谷歌人工智能系统AlphaGo竟然在局势不利的情况下,挑战世界围棋冠军李世石成功,李世石则投子认输。
很多人认为李世石故意放水,李世石则在随后的发布会中表示,“比赛中有两件事让我吃惊,一个是AlphaGo开局下得非常好,第二个是在比赛过程中不断有一些令我想不到的下法。”
李世石说,“我没想到过我会输。我觉得我一开始犯的那个失误一直伴随到了最后,成了我失利最主要的原因”。
创新工场CEO李开复则在这场比赛棋至中盘时就点出李世石的问题:李世石在尝试新打法,这非常不明智。比较好的打法是按照经典标准,以过去专家打法来,会比铤而走险更稳当。
围棋九段、中国国家队著名国手江铸久指出,从李世石布局阶段就能看出来,他今天在心理上一开始就有波动,因为他采取的是非正常的布局。这也说明AlphaGo这5个月进步很快。
李世石败给AlphaGo的背后,是人性与机器的较量。分析称,真正让人感到害怕的不是AlphaGo的棋力,而是它的没有情绪、不知疲倦、沉着冷静。这与AI无关,是机器的本性。
求稳让李世石犯下致命错误
这场谷歌AlphaGo对抗世界围棋冠军李世石的较量,从一开始就像一场在刀锋上的比赛。
开局之初,AlphaGo与李世石的对攻就显得惊心动魄,一度AlphaGo还处于领先位置,不过,在“开战”2个小时后,李世石的优势逐渐开始明显,AlphaGo陷入到劣势。
古力九段点评说,从今天来看,AlphaGo围棋水平比欧洲冠军樊麾要强,已经具备职业强手的素质,但在细节方面刚好离专业差一点。AlphaGo应该是处于业余六七段的水平。
AlphaGo最凶险的时候,古力九段和柯洁九段已做出预测,这一盘棋,AlphaGo基本上输了,“如果是个人类选手,基本上已经可以投子认输。”
在巨大的劣势中,AlphaGo突然又开始抗争,最后反而越战越勇,后发而至,与李世石又形成僵持局面,甚至占有优势。李世石面临的局势又变得非常凶险。
而赢面非常大的情况下,李世石过于求稳,反而被AlphaGo追上,且出现明显失误,损失三目棋。现场解说员表示,AlphaGo与李世石这一番厮杀,他都受不了了。
一直到下午3点30分,李世石投子认输。在这场长达3个半小时的对抗赛中,AlphaGo赢得最终胜利,李世石情绪、体力、心理波动等人性弱点对棋局结果的影响不可低估。
一位围棋界人士点评说,李世石并不输在棋力,而是输在获得优势以后的轻敌,以及之后所犯的错误。尽管AlphaGo也曾出现失误,但在李世石遭遇的失误面前这些失误可忽略不计。
相比AlphaGo,李世石更聪明、棋力更深厚,但AlphaGo的优点是,情绪控制更好,它不会紧张,不会嘚瑟,不会沮丧,也不会体力下降。AlphaGo更像是一位棋力比他稍差的忍者。
实际上,围棋手和围棋手之间的较量,围棋手与机器之间的较量有很大的不同。
两个人下棋的时候,棋手常常会观察和琢磨对方情感和心理。对方是紧张了,害怕了,你在想象对方的同时,这种作用对方也会感到到,折射回来。但和机器下棋,这个就显得很别扭。
更可怕的是,AlphaGo有很强的学习能力,基本没套路可寻。欧洲围棋冠军樊麾曾对腾讯科技表示,面对机器就像面对一堵墙,所有感觉全部都被打了回来,机器却没有心态的波动。
克服人性弱点是战胜AlphaGo的关键
资料显示,AlphaGo使用蒙特卡洛树搜索算法,借助值网络与策略网络这两种深度神经网络,通过值网络来评估大量选点,并通过策略网络选择落点。
机器最初通过模仿人类玩家,尝试匹配职业棋手的棋局,一旦它达到了一定的熟练程度,它开始和自己对弈大量棋局,使用强化学习进一步改善它。
作为一个大数据专家,陈利人认为,人类不可能不犯错,而机器不会犯错。棋局中说到的机器犯错,是人类理解的犯错,而这些选择,是机器精确计算后的结果。
陈利人说,最后我们看到的局部战斗,机器的绝对优势发挥淋漓尽致。人类经常只能看势,模糊估算。但机器在小的搜索空间,完全可以精确计算,找出最优的选择。
“机器下出的不符合通常人类认可的模式,给人类造成了很大的困扰。人类在没有模式可follow的情况下,尝试新的下法,出错(失算)的概率很大,也有可能造成心理的负担。”
尽管李世石输掉了首场比赛,但此次人机世纪大战一共分为5场,还有4场,分别是3月10日、3月12日、3月13日和3月15日。依然有很多人对李世石获得胜利很有信心。
资深研究员戴文渊认为,和AlphaGo对抗时人类需要注意几点:
1,AlphaGo所基于的人工智能技术,强项不在于推演,而是借鉴过去见过的局面。所以,如果要击败AlphaGo,需要尽可能把局面导向历史上没人下过的棋。
2,围棋的边角战斗靠计算,中空战斗靠感觉。既然感觉占优,那就一定要尽量把胜负手留在棋盘中间。靠做“势”取胜,而不是把战火引到边角实地。
3,一旦进入到局部缠斗,尽早将局部肉搏战打完,不要留出大量小区域短兵相接的局面,保持局面尽可能大开大合。
此外,需要格外小心的是,一定要克服自己人性的弱点。局面领先时,避免骄傲;落后时,避免气馁;胶着时,避免紧张。
戴文渊认为,李世石如果能在后面几局注意控制自己的心魔,依然可以扳回不利的局面。
古力九段认为,这盘棋在细微的地方机器跟人还是有区别,AlphaGo要吃亏一些,但李世石也存在很大的失误,就是在战局的右边,当形势一片大好的时候,人出现了松懈。
“由于前面有乐观心态,他连自己最擅长的拼搏都没有了,而是选择安乐的输棋,这让我们对他今天的发挥比较失望。这次失败也会对他敲了警钟,我对他第二场的发挥比较期待。”
尽管输掉比赛,李世石在随后也表示,经过第一场比赛,觉得第二场比赛的胜负会是五五开。
在这场谷歌AlphaGo对抗世界围棋冠军李世石之后,一场新的较量或许也在酝酿。第一场赛后,李世石的对手柯洁发微博表示,“就算阿法狗战胜了李世石,但它赢不了我。”
尽管是1997年出身,但柯洁在2015年世界大赛已豪取三冠,与李世石的交往战绩是8胜2负。不久前刚结束的农心杯三国擂台赛上,柯洁作为主将还力克李世石助中国队捧杯。
谷歌AlphaGo似乎也将目标标准了中国棋手,准备在挑战李世石后,再展开一场较量。AlphaGo围棋创始人哈萨比斯称,希望AlphaGo能与中国的高水平棋手对弈,比如柯洁。
“其实我觉得这次棋谁赢谁输不是最重要的。”李开复说,一旦AlphaGo达到专业二段的水平以后,打败人类只是迟早的事,这个时间点可能最快只要6个月到2年的时间就能到来。