你可能不会下围棋,也对科技也不热衷,但 5 天后的这场围棋对决,全人类都不得不去关注。
北京时间 3 月 9 日中午 12 点,围棋传奇人物李世石将迎来“职业生涯中最重要的比赛之一”。李世石的比赛这么多,为什么就这场成了全世界的焦点?
因为李世石的对手不是人类,而是 Google 研发一个计算机程序,它的名字叫 AlphaGo。
回到 19 年前的 1997 年,同样有过这样一次世纪人机对决,不过主角是 IBM 的计算机“深蓝”以及棋王加里 · 卡斯帕罗夫,下的是国际象棋。
结果我们都知道了,这台重达 1270 公斤的“深蓝”战胜了棋王,计算机战胜了人类。而这一次,因为是代表全人类对阵计算机,李世石说他要誓死捍卫人类的智力:
对 AlphaGO 是我不能输的比赛,甚至一盘棋都不能输。
李世石何许人也?
不关注围棋的人可能不知道李世石。李世石是围棋专业九段棋手,这个段位已是专业围棋棋手中的最高级别。
当然,李世石厉害不在于他的段位,而是他能长年保持一流的水准,时常有神来之笔,兼有强大的战力且计算极为精准。
自 2002 年加冕富士通杯以来,他 10 年时间里共获 14 个世界冠军, 是最近 10 年中获得世界第一头衔最多的棋手,公认的围棋传奇 。
同时,他有着高水准的心理质素,世界大赛上常在落后的情况下一次次地如同僵尸复活一样满血归来,并且总能在最后一刻反败为胜,因而棋风被人称为 ——“僵尸流”。
反观李世石对手,计算机程序 AlphaGo 来自围棋文化和实力并不发达的英国,研发时间不过两年左右。
今年 1 月份, Google 对外宣布 ,AlphaGo 于 2015 年 10 月份战胜了职业二段樊麾,这才声名大噪。职业二段樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。
尽管战胜了樊麾,但 AlphaGo 的棋力在很多围棋职业棋手看来, 仅仅“无限接近于职业”水平,而李世石则是棋坛传奇。
就是这么一场“实力悬殊”的比赛,却被不少媒体渲染为“李世石捍卫人类尊严之战”。
李世石虽传奇,可“人类尊严”为什么要靠一个围棋棋手捍卫?
要回答这个问题,我们首先要弄明白,下围棋对于一个计算机程序来说,是多么困难的一件事。
棋类游戏被视为顶级人类智力试金石,而围棋又是所有棋类游戏中最复杂的。
国际象棋中,平均每回合有 35 种可能,一盘棋可以有 80 回合;而围棋每回合有 250 种可能,一盘棋可以长达 150 回合。
同时,围棋有 3^361 种局面,而可观测到的宇宙,原子数量才 10^80。我们来看看一组衡量复杂度的数据对比:
计算机程序的强处是运算能力,但由于围棋太过复杂,只是依赖蛮算的话,效率非常低。而且,围棋中“虚”的东西非常多,计算机擅长逻辑运算,而不善掌握“虚无”的感觉。
在之前的围棋挑战赛中,由于计算机棋力比人类弱,人类选手都会让子,而且计算机程序主要和业余段位的棋手比赛。AlphaGo 对战樊麾是完全公平的比赛,没有让子。
18 年前,计算机就战胜了人类国际象棋棋王;18 年后,计算机才在没有让子的情况下赢得和围棋专业二段选手的比赛。 在这之前,业内人士普遍认为到达这一成就还要等上 10 年。 至于 AlphaGo 究竟是如何做到的,我们下文再详述。
总的来说,围棋大师是人类智力金字塔顶端的人物,而李世石更是大师中的传奇。AlphaGo 好不容易在没有让子的情况下打败职业棋手,再次主动挑战人类围棋传奇, 将李世石对战 AlphaGo 描述成“捍卫人类尊严之战”并不为过 。
AlphaGo 下的棋,连世界冠军都看不出来是计算机在操作
前面说到,超级计算机深蓝 1997 年击败了加里 · 卡斯帕罗夫。 这与其说是计算机下国际象棋比人类厉害,不如说是靠计算能力欺负了人类。
深蓝是专门针对卡斯帕罗夫棋风设计的弈棋软件,设计过程包含了对卡斯帕罗夫几乎全部对局的 穷举分析 。卡斯帕罗夫平均可以计算 X 回合后的 Y 个变化,深蓝则利用计算能力上的优势,推导出更多的变化。
所谓穷举,是一种数学计算方法,根据部分条件确定答案的大致范围,并在此范围内对所有可能的情况逐一验证,直到全部情况验证完毕。
比如,穷举应用在密码学上被称为暴力破解法。密码如果只有 1 位数字,穷举最多 10 次:1, 2, 3, 4, 5, 6, 7, 8, 9, 0。2 位数字的密码,穷举最多 99 次(00-99)就能破解。
然而穷举法应用在围棋上却非常的低效。上面说到,围棋每回合有 250 种可能,一盘棋可以长达 150 回合,有 3^361 种局面。单纯依靠蛮力去算,进展非常缓慢,永远也不可能击败人类大师。
AlphaGo 聪明的地方在于,加入了“深度学习”技术,设法减少需要穷举的数量。 深度学习能让机器在现有数据的基础上建立自己的逻辑,而不需要专家为每一个问题编写出一个专门的程序来解决。
AlphaGo 的深度学习技术运用到了两个工具——“策略网络”着眼于当下,选择下一步走法。“价值网络”思考得更加长远,预测棋局的走向。 两个深度学习网络结合起来,大大增加了 AlphaGo 穷举的效率,使得计算机在围棋上战胜人类成为可能。
(AlphaGo 用到的两个深度学习网络,左边的是策略网络,右边的是价值网络)
要是还不能明白 AlphaGo 的厉害之处,我们看看 果壳网曾经问过围棋天才柯洁的一个问题 :“假如是不知情地去看 AlphaGo 和樊麾的这五盘棋,你会猜到 AlphaGo 不是人类吗?”
柯洁今年 1 月份刚刚击败了李世石,一年内三次夺得世界冠军。如果当初李世石没有应战 AlphaGo,Google 就会找柯洁了。他的回答是:
完全看不出来。这五盘棋我也仔细地看了一眼,但我没看名字,不知道谁执黑谁执白,完全看不出谁是 AI。感觉就像是一个真正的人类下的棋一样。该弃的地方也会弃,该退出的地方也会退出,非常均衡的一个棋风,真是看不出来出自程序之手。
因为之前的 ZEN 那样的程序,经常会莫名其妙的抽风,突然跑到一个无关紧要的地方下棋。它这个不会。它知道哪个地方重要,会在重要的地方下棋,不会突然短路。这一点是非常厉害的。
简而言之,AlphaGo 不仅是遵循人工规则的计算机程序,它还能通过深度学习技术自行掌握如何赢得围棋比赛,是真正意义上的人工智能。并且它下的棋跟人类没什么两样,连世界冠军也看不出来。
人类 V.S. 计算机,谁的胜算更大?
这个问题其实见仁见智。
“围棋界人士都认为李世石会赢,不管是在感情上,还是棋力上。”国内知名围棋选手王煜辉七段告诉爱范儿。另一方面,不少计算机和人工智能科学家都希望 AlphaGo 可以战胜李世石。
回到 2015 年 10 月份 AlphaGo 对决樊麾那场比赛。
“从公布的棋谱来看,电脑的棋力大致相当于国内业余六段棋手的水平,而且可能还达不到强六(业余六段中的强者)的水平。” 王煜辉这样评价 AlphaGo。
柯洁则称“它(AlphaGo)的水平大概就是冲职业段之前的水平,虽然职业还到不了,但是无限接近于职业了”。樊麾作为一个职业二段棋手输给 AlphaGo,让不少业内人士感到意外。
不过,欧美棋手的段位含金量并不高,樊麾长期在海外,其棋力随时间增长反而会有下滑。柯洁 在接受果壳专访时也提到 ,“可能是因为对手(樊麾)发挥得太糟糕了”。
来到 2016 年 3 月,时间已经过去了将近半年。中国计算机围棋智能第一人刘知青教授告诉爱范儿:
和樊麾的对决仅仅是小试牛刀,由于 Google 保密做得非常严,AlphaGo 棋力长进多少谁都不好说。
今年 1 月,DeepMind 团队曾透露,AlphaGo 在四周的时间里完成了 100 万局的自我对局,也就是说,它一天可以自我对局 3 万局。
韩国首尔科学综合研究生院大数据 MBA 主任教授金镇浩强调,去年 10 月为了战胜欧洲围棋冠军樊麾二段,给 AlphaGo 输入的并不是职业棋手的棋谱,而是 “欧洲业余高手” 的 16 万局棋谱。
自去年 10 月以后,AlphaGO 就以最高水准的职业棋谱为基础在学习。这意味着三月份 AlphaGo 出战之时,它的实际水平会令我们刮目相看。
(曾经的国际象棋棋王加里 · 卡斯帕罗夫)
不管最后李世石和 AlphaGo 谁赢了,这场世纪人机对决的影响力毋庸置疑,吸引了全世界对围棋、计算机和人工智能的关注。
1997 年,全世界数百万人通过电视观看了一场惊人的胜利——一台计算机战胜了欲捍卫世界冠军称号的卡斯帕罗夫,此举震惊了国际象棋界。2016 年,我们有机会在 5 天后见证又一次世纪人机对决,成为历史的一部分。
附比赛日程:
- 3 月 9 日 (星期三):首场比赛
- 3 月 10 日(星期四):第二场比赛
- 3 月 12 日(星期六):第三场比赛
- 3 月 13 日(星期日):第四场比赛
- 3 月 15 日(星期二):第五场比赛
比赛将采用贴 7.5 目的中国规则,每位棋手各有两个小时布局时间,3 次 60 秒的读秒,每场比赛预计需要大约 4-5 个小时。爱范儿将对这场世纪对决进行滚动直播。