观看人机大战第二季的正确姿势:这些你得知道!
编者按:它真的又回来了,自从 2016 年完虐世界顶级棋手李世石之后,它似乎一直都没有离开我们的视线,世界围棋界经历了层层震荡、人工智能话题都从它说起、变身马甲横扫棋坛六十位大将……
5 月 23 日,中国乌镇,已经升级到 2.0 版本的谷歌人工智能 AlphaGo 将重燃“人机大战”战火,而此番来挑战的将是现今世界棋力第一的中国围棋选手柯洁。
文 / 定西
AlphaGo 到底是谁?它又来自哪里?
我们首先来看看它的爸爸们,关键先生是戴密斯 ・哈萨比斯是人工智能科学家、 DeepMind 公司创始人,他 4 岁开始下国际象棋, 8 岁自学编程, 13 岁获得国际象棋大师称号, 17 岁进入剑桥大学攻读计算机科学专业。在大学里,他开始学习围棋。 2005 年进入伦敦大学学院攻读神经科学博士,选择大脑中的海马体作为研究对象。
两年后,他证明了 5 位因为海马体受伤而患上健忘症的病人,在畅想未来时也会面临障碍,并凭这项研究入选《科学》杂志的“年度突破奖”。 2011 年创办 DeepMind Technologies 公司,以“解决智能”为公司的终极目标。
还有大卫 ・席尔瓦 ( David Silver ),他是剑桥大学计算机科学学士、硕士,加拿大阿尔伯塔大学计算机科学博士,伦敦大学学院讲师, Google DeepMind 研究员。除此之外,阿尔法围棋设计团队核心人员还有黄士杰( Aja Huang )、施恩・莱格( Shane Legg )和穆斯塔法・苏莱曼( Mustafa Suleyman )等。
而阿尔法围棋( AlphaGo )其实就是一款围棋人工智能程序。
它主要的工作原理是 “深度学习”。深度学习是指多层的人工神经网络和训练它的方法,一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。
阿尔法围棋用到了很多新技术,如神经网络、深度学习、蒙特卡洛树搜索法等,使其实力有了实质性飞跃。美国脸书公司 “黑暗森林”围棋软件的开发者田渊栋曾发表分析文章说:“阿尔法围棋系统主要由几个部分组成:
一、 走棋网络( Policy Network ),给定当前局面,预测 / 采样下一步的走棋;
二、 快速走子( Fast rollout ),目标和走棋网络一样,但在适当牺牲走棋质量的条件下,速度要比走棋网络快 1000 倍;
三、 估值网络( Value Network ),给定当前局面,估计是白胜还是黑胜;四、蒙特卡洛树搜索( Monte Carlo Tree Search ),把以上这三个部分连起来,形成一个完整的系统。”
AlphaGo 在那年春天一战成名!
2016 年 3 月 9 日至 15 日在韩国首尔举行了韩国围棋九段棋手李世石与人工智能围棋程序“阿尔法围棋”之间的五番棋比赛。
比赛采用中国围棋规则,最终结果是人工智能阿尔法围棋以总比分 4 比 1 战胜人类代表李世石。
2016 年 3 月 9 日,赛前猜先阿尔法围棋猜错,李世石选择黑棋,率先展开布局。黑棋布局走出新型,阿尔法应对不佳,出现失误。李世石抓住电脑布局不擅长应对新型的弱点获得不错的局面。但围棋的胜负关键往往是中盘阶段。阿尔法围棋之后的下法变得强硬,双方展开接触战。李世石抓住机会,围住一块大空,在大局上抢得先机,但他却放出了非常业余的手法,最后李世石算清后投子认输。
2016 年 3 月 10 日,围棋人机大战展开第二局较量。阿尔法围棋执黑先行,李世石转变了行棋的风格,开局下得非常稳健,你来我往中,黑 37 和 41 两步尖冲令人匪夷所思,尤其是第 41 手,致目数大亏。中盘阶段,本来形势占优的李世石行棋过缓,右上角的一步二路打拔被视作败手,阿尔法围棋的优势逐渐清晰起来,阿尔法 2 比 0 领先。
2016 年 3 月 12 日,围棋人机大战展开第三局较量。李世石执黑先行,该局开始前,还有棋迷希望李世石能够实现逆转,但阿尔法围棋彻底摧毁了这种可能。布局阶段,李世石左下挂角后走高中国流。行不到二十手,李世石局面就落入下风,围棋人机大战前三盘人类三连败。
2016 年 3 月 13 日,围棋人机大战展开第四局较量。在接连三局负于“阿尔法围棋”后,脱去胜负包袱的李世石为荣誉而战,终于迎来了“围棋人机大战”的首次胜利,“阿尔法围棋”判断局面对自己不利,每步耗时明显增长,更首次被李世石拖入读秒。最终,李世石冷静收官锁定胜局。
2016 年 3 月 15 日,围棋人机大战展开第五局对决,李世石在 79 和 81 手连出缓手,被视为败招。阿尔法围棋 82 靠也并非好的应手。一波错进错出后,黑棋在 87 和 89 手再出缓手,致使白棋左上角的围剿更加有力,黑棋形势瞬间坍塌。此后,占据优势的阿尔法围棋展现了它强大的中后盘计算能力,鲜有失误,落子效率极高,最后李世石投子认负。
Master,批个马甲我们就不认识你了?
2017 年的岁末年初,一个名叫“ Master ”的神秘网络围棋手轰动了围棋界,从去年 12 月 29 日开始,它在几个知名围棋对战平台上轮番挑战中日韩围棋高手,并在 1 月 3 日晚间赢了中国顶级围棋手柯洁,取得了 50 胜 0 负的惊人战绩,但这还没完, Master 最后的战绩是 60 战全胜。
在 Master 获得 50 连胜之后,古力九段表达了自己的看法。古力九段称, 50 连胜令我等职业棋士汗颜,也许曾经我们认为永恒不变的围棋定式、真理,会因 Master 的出现发生颠覆性的改变。此前,古力甚至公开张贴“赏金榜单”,悬赏十万击败 Master 。
最后,就在 Master 取得第 59 场连胜后, Master 账号宣布自己就是 AlphaGo ,而代为执子的就是 AlphaGo 团队的黄士杰博士!
棋士柯洁有制服 AlphaGo 的灵丹妙药?
曾在李世石与 AlphaGo 比赛之时,中国围棋高手柯洁就一度成为焦点,请他出山对阵 AlphaGo 的呼声一直从未停止。
但对已经领略过 AlphaGo 实力的他来说,对这次比赛的看法显得非常谨慎,赛前柯洁曾表示:“我有点小紧张,但不会轻易言败,在阿尔法围棋出现之前,我以为计算力是 AI 的优势,后来让我震惊的是他的大局观, AI 的宏观思维让我很佩服, AlphaGo 围棋让我们重新思考,这么下是不是错的,会给我们很多启发,输的痛苦是外界无法想象的,我会不惜一切去追求胜利”。
大战即将打响,从 23 号开始,开幕式、柯洁 vs AlphaGo 三番棋第一场; 5 月 24 日,人工智能论坛; 5 月 25 日,柯洁 vs AlphaGo 三番棋第二场; 5 月 26 日,配对赛,团队赛(相谈棋); 5 月 27 日,柯洁 vs AlphaGo 三番棋第三场。
这次,用实力见真章,人机大战第二季,请跟随网易智能全程聚焦!