你知道李世石输了，可你知道Alphago是怎么赢的吗？

咕噜网 • 9年前扫码分享

你知道李世石输了，可你知道Alphago是怎么赢的吗？.webp

【咕噜网编辑】昨天，小巴发现办公室小伙伴都在关注李世石和Alphago的五番棋大战Round 1。下午，优势几经换手后，李世石输了。

办公室小伙伴有的支持李世石，有的支持Alphago。李世石的“棋盘宿敌”古力九段说，根据他以往打交道的经验，李世石的调整能力很强，而且今天的白棋相比于昨天的黑棋更胜一筹。而同样有人认为，Alphago在第一局就证明它的能力，有着自己完美的的棋盘逻辑，赢下了第一盘之后，没有理由会输第二盘。

不管如何，小巴对于计算机能够在围棋上打败人类最顶级棋手感到吃惊，这或许真的是划时代的一天。更好奇的是，Alphago到底是如何击败李世石的？

为什么对计算机来说，围棋好难好难？

李世石和Alphago对弈现场.webp

李世石和Alphago对弈现场

下过五子棋的小伙伴应该知道，先手的人有必胜的一套走法，因为先手的人可以将后手的每一步都计算在内，并顺利达成胜利。其实所有的对弈类棋盘游戏道理都一样，在理论上存在一种必胜的走法，只要把每一步对方的下法都估计在内，就可以选择一种最优解并且获胜。19年前，IBM的计算机“深蓝”就用类似的方法战胜了当时的国际象棋第一人卡斯帕罗夫。

可是，对于围棋来说，这就不太行得通了，因为围棋更复杂。如果把每一步的所有可能下法都算在内，小巴数了数，大概有10的360次方（没错，就是1后面跟着360个0）种可能，比全宇宙所有微粒子加在一起的数量还要大。

这样下好费脑，人类肯定是做不到了，一般人算几步估计就脑死机了。计算机也好不到哪里去，肯定没算到一半也死了，只能一边冒着烟一边随意落子。

人类是如何避免这种作死的暴力棋法？

李世石和Alphago对弈海报.webp

李世石和Alphago对弈海报

从计算的意义上而言，人类下围棋其实是偷懒的，每一步落子的过程大概是这样的：

第一步，看清棋盘全局，在棋盘的边、角或中腹等部分，初选出几个可落子的点；

第二步，分别预计对手的几种应对方式，估计落子后的形势和赢面，选择其中最有利的一种走法。

所以，人类下棋方式其实是计算能力不够的时候，一种有限理性的妥协。人类所凭借的 “棋感”，有的时候是直觉，有的时候是经年累月由历史经验所得出的定式——即经过前人验证的局部最优解，不管入门级别的业余爱好者，或者李世石这样最顶级的棋手，都是如此。

Alphago去年战胜欧洲围棋冠军樊麾，昨天击败李世石，下围棋的手法和人类完全没有什么两样，秘密就在于它也具备了这种“棋感”。

Alphago如何“聪明”得像一个人？

李世石和Alphago之父哈萨比斯.webp

李世石和Alphago之父哈萨比斯

其实，Alphago之所以在下棋的时候“聪明”得像一个人，就是因为它拥有几项类似于人类大脑的功能，从而可以模仿人类下棋的步骤。

首先，它拥有一个数据库，里面有十几万份人类6-9段职业棋手的对弈棋谱。Alphago从中模仿人类常见的落子方式，根据谷歌透露的数据，模仿的准确率达到了57%。也就是说，单单这一项功能，就可以使Alphago在一步的选择上有57%的概率与人类高等级职业棋手相同。这是“模仿大脑”。

其次，它可以自己与自己对弈，根据选择“模仿大脑”计算出的下一步落子的不同选择，不停往下落子，直到分出胜负为止，根据结果反馈“模仿大脑”，从而优化棋路，这是“学习大脑”。如果两台Alphago对弈，有一台直接使用来源于“模仿大脑”的落子选择，另一台选择经过“学习大脑”优化的棋路，后者的获胜概率达到80%。

最后，它还有一个“局面判断大脑”，用以判断当下局势的赢面，准确率也接近80%。

Alphago拥有了这几项功能后，就可以实现上面提到过的人类下棋的模式了：

第一步，根据棋局，快速使用“模仿大脑”选出一步棋（往往也是多种选择）；

第二步，每一种选择，都使用“局面判断大脑”，判断落子后的局面，再往后模拟一步。

将基于模仿人类选择出来的多种可能性都计算过之后，Alphago会选择那种赢面最大的方式。

这也是一种在有限范围以内的理性解法，模拟了人类的习惯，很多很“傻”的下法就会自动被排除。它的学习迭代方式，和人类相似，就像人类碰到了火觉得疼，所以不再碰火，或者吃到食物觉得美味，所以下一次也会再吃一样，都是由经验的反馈所驱动的。

很快，人类下棋都比不过计算机了？
世界围棋冠军李世石.webp

世界围棋冠军李世石

从此前Alphago 5:0完胜欧洲围棋冠军、职业二段棋手，世界排名top1000的樊麾，以及人机五番棋第一局击败前世界围棋第一人、当下排名第5的李世石，我们有充分理由相信，Alphago在围棋上的能力，已经达到了相当高的水准。

而了解了Alphago的学习能力原理后，不管五番棋大战结果如何，我们大概可以这样预测：很快，Alphago学习了更多的棋谱，数据处理的能力得到进一步提升之后，棋力达到了人类的最高水平。又因为计算机没有情绪和生理问题，在所有对弈中，它都可以“把自己拉到与对方同一水平线上，然后用丰富的经验打败他。”

所以，此前搜狗CEO王小川预测：不仅仅是围棋，人工智能在其他博弈类的封闭游戏里，也会横扫一切，完胜人类。

比肩人类的人工智能是否即将出现？

李世石、哈萨比斯和谷歌董事长埃里克.webp

李世石、哈萨比斯和谷歌董事长埃里克

人工智能其实早已出现在人类生活中，比如常见的吸尘机器人、Siri的语音回复、人脸识别等等。但它只会做一件或少数几件事情，只能解决已经出现过的问题，这其实是弱人工智能。

而人类称为独一无二的智慧生命，不同于机器的区别就在于学习和自我迭代的能力。

Alphago展现的模仿和学习能力，让小巴相信，不用太久，具有解决从未遇到过的问题的能力、在各方面都能和人类比肩、可以视为与人类相等的智慧生命的高级人工智能就会出现。

cnguluweixin

分享到：