Wired评论员点评AlphaGo第五场比赛

百度百家 • 8年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

具有划时代意义的围棋“人机对决”，最终谷歌的人工智能AlphaGo以4：1的成绩战胜了韩国围棋大师李世石。

中国总理在3月16日举行的记者招待会回答记者关于中日韩关系时意外谈及AlphaGo与韩国棋手围棋比赛，表示对比赛结果不评论，但是机器是人造的。

李世石虽然已经不能改变自己落败的结局，但是在第五局仍然非常努力。在AlphaGo犯下明显错误之后——一个在人们眼里看起来非常业余的错误——李世石暂居领先地位。第五局比赛是继第二局比赛后最令人兴奋的场次，第二场比赛中AlphaGo惊为天人的37子以及第五局比赛那种刀刃上的平衡的紧张局面，其戏剧性和观赏性甚至超过了李世石在第四场比赛中的胜利。

这个韩国选手用自己的一己之力展示出人类独有的天赋，这是机器不能复制的。在这场五局比赛的早期，他备受压力困扰，对正常能力的发挥造成了一定的影响。但是随着比赛的进行，他逐渐适应了这个特别的对手，并从和它对弈的经验中发现了一些AlphaGo暂时还做不到的事情。

民族英雄

人们对第五局的比赛的关注和热情丝毫未减——如果你意识到这是一场在三天前便胜负已定的比赛时，你会理解这是一件非常了不起的事情。AlphaGo横扫三局比赛，捧回100万美元的奖金。李世石在第四局比赛中改变了战术并取得了胜利，在一群欢呼雀跃的韩国记者包围下走进了记者发布会会场。

在李世石取得了第四局比赛的胜利后他表示，“因为这是我在连输三局以后的第一次胜利，它非常有价值，重要到我不会用它去交换世界上的任何东西。这个结果源于你们给予我的喝彩和鼓励。”

这场比赛在韩国备受关注，它几乎占据了本周各大媒体所有的头条版面。如果你打开宾馆的电视或者坐进有广播电视的出租车，关于这场比赛的消息就会跳进你的眼帘。在第五场比赛开始前几个小时谷歌人工智能试验室的领队Demis Hassabis在世宗大道的林荫路上再一次被韩国民众认出，这位韩国妇女张开手臂，吃惊的长大了嘴巴。这个场景就像她看到碧昂斯和Lady GAGA手挽手逛街一样。

更难的路

但是相比于Demis Hassabis和AlphaGo，韩国民众更支持的是李世石，他那张孩子般的脸频频出现各大媒体的首页上。这些来自公众们关注与关爱给李世石带来了巨大的精神压力。在他输掉第三局比赛之后他向所有对他抱有期望的人道歉，“今天我不知道该说些什么，但是我认为我需要先表达我的歉意。我本应该表现的更好，给出更优的结果。”

他在第五场比赛中主动要求持黑子，这意味着AlphaGo会率先落子，他将自己置于了一个更加困难的境遇。他想要以未曾有过的方式取得胜利。“我真的希望我可以用黑子赢一次”他说，“因为用黑子赢才更有价值。”

进攻与否

随着第五场比赛开始，人们都很关心李世石这局是否会继续积极进攻，还是会更加谨慎。在第四局比赛中李世石以非常强势的进攻赢得胜利，但那时他是持白子。大概在这场比赛的第九手，这个韩国选手开始进攻，力求夺下棋盘右手边的疆域，而不是谨慎的看守全局。一般来说，李世石是一个有侵略性的选手，他正在使用他最擅长的方式。

对比与前面的三场比赛，李世石以更快的速度落子。在第二局、第三局和第四局他都陷入了时间的困境，在早期花费了太长时间去思考如何落子。比赛进行四十分钟后，他所剩余的时间和AlphaGo相仿。

机器在这样的比赛中是有特定优点的，它不会感觉到压力也不会感觉到疲累。但是李也并不是毫无优势，在比赛的过程中谷歌是不能基于对手的表现改变战略的，因为Hassabis和他的团队需要几周的时间来重新训练AlphaGo, 直至比赛结束他们都不能对这个系统有大的改动，但是李世石可以。到了第五场比赛，李世石似乎已经积累了很多和机器对弈的经验，调整自己以期取得胜利。

天才的故事是否可以重演

比赛开始了一个小时后，李世石继续采用激进的攻势。用Redmond的话说，他的策略是“开疆扩土”。而这个办法在第四场比赛里面发挥了作用，第78手位于棋盘中间的“挖”，出乎意料的改变了正常比赛的态势。而在78手之前现场评论员和围棋爱好者都认为谷歌机器在本局比赛中有显著的优势。正如Demis Hassabis在推特上发布的，“AlphaGo并没有预计到人类会如此落子，而第79手这个机器犯下了一个致命的错误。” 几分钟内，分析了游戏状况的AlphaGo已经计算出它获胜的机率下降了。最终AlphaGo投子认输。

看起来AlphaGo 并不善于处理人类这种突然间的茅塞顿开——采取一个其他人类不太可能选择的落子方式。但是随着第五场比赛的进行，看起来人们对李世石再次闪现如此天才的想法抱有了过多的幻象。

比赛进行一小时二十分钟后，评论员评论说AlphaGo表现的非常松懈。这是因为AlphaGo是以最终获胜为目标，所以对疆域上的胜利并不在意，所以在人类看来才会显得“松懈”。

可怕的损失

现在李世石和AlphaGo落子都非常迅速。 “我勉强能跟上这场比赛的进展速度，” Redmond说。虽然韩国选手用掉了更多的时间，但是仅多于AlphaGo一点。AlphaGo的剩余时间是一个小时24分钟，而李世石的剩余时间是一小时12分钟。时间用尽后，该方选手需要在60秒内落子。

有了猛烈的进攻态势李世石“杀”到了棋盘下方，而且AlphaGo似乎在这个区域中犯下了一个主要的错误——一个即使是中级水平的人类选手都绝不会犯的错误。 Redmond评论说，“这是黑子的疆域，AlphaGo最终可能会遭遇到可怕的损失，而这种损失非常有可能让该局比赛朝着更利好于李世石的方向发展”。

Redmond说， “李世石觉得即使是仅仅两到三的额外得分，也可为他赢下该局贡献力量。”

但是棋局还远未到快结束的时间点。随着时间的继续，Garlock和Redmond 感觉这局比赛和第三局、第四局都有些许相似之处。棋盘上虽然还有很多开放的空间，但可选择的落子方式有限。“我看不到任何黑子可以安放又不被白子包围的可能性,” Garlock说。

危险的阶段

比赛进行两个半小时后，Redmond感觉到比赛已经进入到“危险阶段。”但是他仍然觉得韩国选手暂时领先。

四十五分钟之后，战斗仍然在上演。“这是一个非常复杂的游戏,” Redmond说。 “在中间位置有太多的铰链。” 并且随着游戏的进行到三个半小时的时候，李世石开始遇到时间不够的麻烦。他的时间不到5分钟了，然而AlphaGo仍然有将近30分钟的时间。问题是：棋盘右手上方的位置仍然有很多地方是空着的，争取那个空间并不容易。

事实上，不久他的时间就用光了，并且之后他没能在60秒内落子。再超时两次他就会直接被判这局比赛失败。在他赢得第四场比赛的时候，韩国选手很有戏剧性地一定要等到最后一秒才肯落子，这将意味如果他稍微拖沓便会失去那场比赛。

4：1获胜

这台机器显然在时间管理上比这个韩国选手更胜一筹。它的时间还剩下了16分钟。

这个谷歌系统一再使出现场评论员不是很能理解的奇怪招数。当然我们也不能否认这些奇怪的招数在战胜李世石的过程中所贡献的力量。

之后AlphaGo用光了它的时间。每个选手都必须在60秒内落子，李世石有两次都用时超60秒。再超时一次，他将直接失去这局比赛。比赛进行到四个半小时的时候，场面还是难分伯仲。

Redmond开始观看棋盘，计算每一个选手可以得到的分数，发现似乎有一方稍有优势。“不幸的是李世石，我觉得白色可能有微弱的优势”他说。当比赛进行到五小时的时候，Redmond开始承认Alphago的胜利。他说，“但很难说，李世石哪里做错了。”几秒钟后，这位韩国选手投子认输。

在比赛的早些时候，AlphaGo就犯了一个错误，这个错误是一个中级的选手都不会犯的错误。这也说明AlphaGo并没那么可靠。在它的教育过程中存有漏洞。但是它通过几个月以来的自我对弈，它还有能力能够爬出深坑，甚至是对抗世界上最好的选手之一。虽然人工智能是有缺陷的，但是它已经走了这么远了。