Wired评论员如何评价AlphaGo第三场关键局比赛
首尔,韩国。谷歌的人工智能AlphaGo在和韩国围棋大师李世石的五局比赛前四场中取得了历史性的胜利。AlphaGo在这次举世瞩目的人机大战中目前3-1的大比分领先,已经赢得了谷歌提供的一百万美元的奖金,这笔钱将被用于慈善事业。
关键第三盘比赛李执黑子,拥有显著优势,因为黑子先行。另外,李可以通过前面的两场比赛积累了一定的和AlphaGo对弈的经验,但谷歌的团队却无法在比赛中调试AlphaGo,这是李世石的另外一个优势。
有传言说第二场比赛失利以后,李曾和另外几位顶尖棋手熬夜对前两场比赛进行复盘,分析AlphaGo的弱点。但是这场比赛的英文评论员Michael Redmond并不认为这是最终扭转乾坤的好办法,他认为,李世石目前应该把主要精力放在自己喜欢的打法上,而不是去找AlphaGo的弱点。但是传言还是给本场比赛添了许多爆点。
谷歌前首席执行官Eric Schmidt和另一位谷歌最重要的工程师Jeff dean都在第一场比赛开始时入住了韩国首尔市中心的四季酒店。另一位谷歌重量级观赛者则是第三场比赛开始前低调飞往首尔的谷歌的创建者Sergey Brin。对他们来说,这场比赛代表了谷歌的未来。AlphaGo核心的学习技术已经在这家互联网巨头提供的服务中得到了运用,比如照片中的人脸识别,智能手机中语音命令识别,以及互联网搜索结果的识别等等。他们把理论上的研究尽最大的可能的进行了机器化的再发明。
本场比赛对于李世石来说同样至关重要,第三场比赛开始时,李显得压力很大,毕竟这场五局三胜制的比赛,他应该取得至少一场胜利。为了去除杂念,他蜷在椅子上,并且闭眼以便让自己平静沉淀下来。
主动性的开局
李世石的开局意图明确。最开始,李世石下子很迅速,并没有保守维稳的态势。据Redmond说,这个韩国选手的开场非比寻常,或许是在意图逼迫AlphaGo将注意力放在一个新的方向上。在短短的45分钟内,Redmond就已经觉得这局棋已经到了一个全新领域。“这句棋也许已经变为我们在专业比赛中从未见过的情况了,”他说。
当然棋局发展到这个状况不仅仅是因为李世石的开局,还是因为AlphaGo一向是以独特的方式去下棋的。因为利用了深度学习和加强学习技术,毫不夸张的说这个机器可以像人类一样下棋。但是它去常常以不符合人类章法的方式去布局。
这个特点很大程度上在第二场比赛充分体现。在第19子的时候,AlphaGo使出了让所有人都震惊的一子。李世石花去了将近15分钟才做出回应。 现场评论员甚至都不知道该如何评论这一子。
谷歌前首席执行官Eric Schmidt
很“李世石”
第三场比赛很不同。在比赛进行到一小时20分钟的时候,Redmond评论说 “这场比赛很‘李世石’,”意思是说这个韩国选手在这场比赛中发挥了自己的真正水平和特点——使用快速又侵略性的战法。但是AlphaGo也一样具有进攻性, Redmond将其描述为“战斗”。他还不能确定哪一方处于领先地位。
其实这更符合围棋的特点——它是一种以细小增量获取胜利的比赛。这项古老消遣方式的是如此复杂,以至让本周的比赛意义重大。就如Google所描述的:围棋里面的可能性比宇宙中的原子的数量还多。评论员Michael Redmond即使同时也是一名非常有天赋的围棋选手,评论这场围棋比赛对他来说也是件非常困难的事情。作为一名围棋选手Alpha的优点是它会不断的计算自己获胜的可能性,并且每一个移动都在为增大这个可能性而做出努力。
很显然Redmond的评论是一直跟随着比赛的进展的。这场比赛最焦灼的地方是棋盘的左上角。如果我是李世石,我也会担心自己是在使用黑子,” 他说。也就是说,将对弈重点从棋盘左上角延伸到棋盘中间对李世石来说是一件非常有压力的事情。
正如谷歌的研究人员Thore Graepel本周早些时候解释说的,因为AlphaGo 尝试最大化它获胜的机率,它并不在意是否要在领地上压制对手。Graepel进一步解释说有时AlphaGo看似松懈的下棋方式似乎是在暗示它相信自己获胜的可能性非常高。Redmond也在比赛过程中提到了AlphaGo的“松懈”。
“现在就来判断谁胜谁负还为时过早,大部分棋盘还空着呢”, Redmond说。
“打劫”理论
几分钟之后,李世石趁机引入了“打劫”的战术技巧。(译者注:打劫,是指黑白双方都把对方的棋子围住,这种局面下,如果轮白下,可以吃掉一个黑子;如果轮黑下,同样可以吃掉一个白子。因为如此往复就形成循环无解,所以围棋禁止“同形重复”。根据规则规定“提”一子后,对方在可以回提的情况下不能马上回提,要先在别处下一着,待对方应一手之后再回“提”。还有一个规则,阻止这样的无限循环。)
在一二场比赛中,AlphaGo看起来一直在尝试避免棋局进行到这样的状况。但是Redmond淡化了“打劫”战术的重要性。他指出即使是在去年的十月份,还没有如此精通围棋的AlphaGo也在非公开场合战胜了三届欧洲围棋冠军樊麾,那个时候它便会应用“打劫”了。 “我怀疑“打劫”会是这场比赛的重点所在,”Redmond 说。
在任何情况下,劫都没有发挥出来。用现场两位评论员的说法,在AlphaGo继续移子的时候,李世石守住了棋盘右手边的疆域。
时间问题
两小时四十分钟后,临近比赛将近结束,但比赛结果并不明朗。但是李世石又出现了第二局时间不够用的情况。在AlphaGo 还有将近一个小时的思考时间时,李世石只剩下了不到20分钟。一旦选手用完该时间,在接下来的比赛中每子便都必须在60秒内出手。
在比赛进行到三个小时的时候,另一位评论员Garlock说: “这看起来对李世石来说很困难。” Redmond表示同意,棋盘下方,李世石濒临失去大量棋子的危险,而且他的思考时间只剩将近十分钟了。之后,时间用尽,Redmond表示这个韩国选手除了使用一些极端的战术外别无选择。之后李世石没能在60秒内做出要下哪一步的决定。若再有一次超时,他每次的出子时间便只能控制在30秒以内了。Redmond 越来越觉得AlphaGo会取得该局胜利。但是李世石并未放弃。
同时, AlphaGo在每一步都花去更多的时间。 在这个方面,它的方式像一个人类。Redmond说,它的这个做法和很多顶级的选手在尝试压制对方并最终获胜的时候都会使用。
之后AlphaGo玩了一招的并不十分高明的“打劫”。并且在最后,Redmond放弃了他之前所表示的“AlphaGo会处理打劫的认知。” “我想对于‘打劫’的问题,我们得到结果了,他说。李世石仍然在努力。但是。在时间刚刚到了四个小时的时候,他投子认输了。
仅在几天之前,在大多数的围棋社区都不认为这样的事情有可能发生,但是这些胜利都很果断。