谷歌人工智能连赢人类围棋冠军5局,它怎么做到的,如何评价它?

虎嗅网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
谷歌人工智能连赢人类围棋冠军5局,它怎么做到的,如何评价它?

一石激起千层浪。当人工智能战胜人类……这个原本看似遥远的事情真正的发生了,在2015年10月5日,全程没有让棋。


1月28日,《金融时报》援引《自然》杂志的报道,由谷歌伦敦子公司DeepMind开发的AlphaGo机器,以5:0的战绩击败了欧洲围棋三届冠军樊麾(出生于中国,现籍法国)。DeepMind是2014年被Google以4亿英镑的价格收购的人工智能团队。


在1月27日,DeepMind团队发表的《Mastering the game of Go with deep neural networks and tree search》作为《自然》(Nature)封面论文上线。团队创始人Demis Hassabis表示,他们开发的围棋程序AlphaGo融合了高级树状查找和深度神经网络。


同一天,Google在官方博客中表示:“我们很骄傲地公告天下,我们的科学家已经搞定了围棋,并攻克了人工智能领域的一项重大挑战。”


今年3月,AlphaGo将在首尔与过去十年全世界最顶级的围棋选手李世石对决。


谷歌AlphaGo是怎么赢的?——双大脑工作


19.png

通过对神经网络进行的3000万步训练 (所有棋谱均来自人类专业棋手的比赛),AlphaGo预测出人类对手下一步走法的正确率已经达到了57%,之前的纪录是44%。


AlphaGo使用两个不同的神经网络“大脑”,通过两者合作得出移棋决定。


根据微信公众号 《人工智能学家》 对上述论文的编译得知,AlphaGo的两个大脑分工如下:


大脑1:“监督学习(SL)政策网络”。着眼于棋盘中的位置,并试图决定最佳的下一步。实际上,它用来估计每个合法下一步行动为最好的一步的可能性,其顶层猜测就是具有最高概率的那步。该团队通过几百万个优秀的人类棋手在KGS上的下棋选择,训练这个大脑,其目的仅仅是复制优秀的人类棋手的移动选择。它一点也不关心赢得比赛,只下那步顶级人类棋手会下的那步棋。 AlphaGo的下棋选择器有57%的概率可以正确匹配优秀的棋手下棋选择。


大脑2:“价值网络”。它不猜测具体的下一步怎么走,而是通过设想的棋盘分布,估计每个玩家赢得比赛的概率。它通过提供整体的位置判断来配合“监督学习(SL)政策网络”。这个判断只是近似的,但它对加快阅读速度非常有用。通过将未来可能的位置分为“好”或“坏”的分类,AlphaGo可以决定是否要沿着一个特定的变化进行更深的阅读。如果位置评估器说某个具体的变化看起来情况不妙,那么AI可以跳过阅读,不沿着那条线继续发挥。


据论文介绍,当只使用一个大脑时,AlphaGo大概和目前最好的电脑围棋AI实力相当,但结合两个大脑是,它可能达到人类职业棋手的水平。


专业围棋手是怎么看的?


2013-2015年三度欧洲围棋冠军樊麾,也是本次人机大战的主角之一,他表示:


在中国,围棋不仅是一项比赛,它还是生活的一面镜子。我们说,假如你的棋下得有问题,那很可能是你心性的问题——棋如其人。


输棋确实很难过。和AlphaGo对战之前,我觉得我能赢。在第一局失利后,我改变了战术,增强了进攻,但还是输了。问题是人类有时会犯致命的错误,因为我们是人。有时我们会疲惫,有时我们求胜心切,我们总有这样那样的压力。电脑程序不会这样,它非常强,也非常稳定,简直就像一堵墙一样。对我来说这是很大的差别。我知道AlphaGo是个电脑,但如果没人告诉的话,我可能会觉得它是个有点陌生却又非常强大的对手,是个真人。


当然,输掉比赛让我不太开心,不过作为职业选手,我们输过很多比赛。所以,失败了就从中学习,也许会有所收获。总之从长远来讲这是一件好事。


随后在一个微信群里, 樊麾说:一切都是真的,因为一直在保密中,所以大家都不知道。我没有放水,不过下得确实不好。只能告诉大家,这个系统确实很强! 拭目以待和李世石的棋吧!这是去年10月下的,还有些条款在保密范围之内的,我不能告诉大家,不过我觉得跟李世石的棋会很精彩!”


曹大元九段: 昨晚就看到了,所以睡不着觉了,压力很大啊!


孟泰龄: 我认为樊麾布局有三盘占优,另两盘劣势。我觉得电脑确实有职业水准。感觉电脑棋风稳健,酷爱实地,如果后半盘它真的可以滴水不漏的话,那距离顶尖真的只有一层窗户纸的距离了。 显然电脑大局观差一些,但局部棋型的感觉及计算已经有相当水准了。


业内人士怎么看?


DeepMind创始人Demis Hassabis:


AlphaGo正在突飞猛进,甚至会超越最棒的人类选手。能够看它在围棋规则内去创造新的东西,感觉很神奇。我们对自己创造的这个系统有种很密切的感情,特别是它被创造的方式——它会学习,我们也会教它,它的风格就像人一样。和其他编出来的程序不同,你不知道它到底都会什么,因为它能够自己学习。


阿尔伯塔大学计算机科学家、Chinook设计师 Jonathan Schaeffer:


我想这还不是围棋版的深蓝时刻。真正的成就是这个程序能作为选手在顶级比赛中较量的时候。深蓝从1989年开始就常常战胜各路大师,最后登顶则是八年之后的事情。但就目前情况来看,我认为AlphaGo和顶级人类选手之间的差距被大大缩短了。可能只需要再进行一点努力和改善,再提高一点计算能力,不出一两年,它就能打败人类。


就今年3月份的比赛来说,不是打击AlphaGo团队,我还是看好人类。我们可以把AlphaGo看成是少年天才。它突然学了一手好棋,进步神速,但毕竟还是经验有限。从国际象棋和西洋跳棋来看,经验还是很重要的。


国际围棋联合会秘书长Hajin Lee:


当我知道那个电脑要挑战职业顶尖棋手李世石的时候,真的很吃惊。我当时觉得这个挑战者绝对对顶级选手有多强完全没概念。但实际上,可能我才是那个不知道这个电脑有多强的人。现在我对这个比赛非常兴奋。


谁会赢呢?我不知道。李世石自己也觉得可能那电脑跟他一样强。可能是我听到了太多AlphaGo的消息,我现在惊讶于它的强大。同时我也非常了解李世石的水平,所以我认为他们双方五五开吧。


我觉得围棋是个很有内涵的竞技,我不觉得如果电脑AI击败了人类会对围棋造成什么伤害。我想人们会接受自己被电脑技术超越这件事。


最后,让我们通过下面五张GIF图回顾一下这五局棋,樊麾是怎么输给谷歌AlphaGo机器的(来自 微信公众号:棋文弈事 ):


13.gif
第一局

14.gif
第二局
15.gif
第三局
16.gif
第四局
17.gif 第五局
本文参考了微信公众号: 人工智能学家 棋文弈事 ,以及 参考消息 雷锋网 等网站的相关报道。

本文被转载2次

首发媒体 虎嗅网 | 转发媒体

随意打赏

提交建议
微信扫一扫,分享给好友吧。