李世石首赛认输,谷歌AlphaGo成就人工智能“登月事件”

虎嗅网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
李世石首赛认输,谷歌AlphaGo成就人工智能“登月事件”

围棋世界冠军李世石与谷歌人工智能程序AlphaGo (据说被国内网友亲切地称为“阿尔法狗”) 首战打响!此次人机对战将于北京时间3月9日-15日在首尔四季酒店举行,具体日程为:3月9日进行首场比赛,此后的3月10日、3月12日、3月13日、3月15日里,每日进行一场比赛。Youtube将对本次赛事进行全程直播,国内棋迷也可通过B站、网易等渠道观看。


YouTube首场比赛直播页面


继1997年IBM超级计算机“深蓝”击败国际象棋世界冠军卡斯帕罗夫以后,人工智能又向人类博弈游戏的最后堡垒围棋发起了挑战。事实上,就在不久前,谷歌已在《自然》上刊登论文,宣布旗下DeepMind (“深层思维”) 开发的人工智能程序AlphaGo,在十九路围棋分先5比0击败了欧洲围棋冠军、旅法职业棋手樊麾二段 (中国棋院) 。有 媒体 评论, 若此次AlphaGo战胜李世石,哪怕只胜一盘,也将成为计算机发展史上的“登月事件”。


比赛还没开始,全民就已经热情高涨 (尽管有大批像小编这样对围棋一窍不通的人= =) 。截至开战前1小时,B站已有8,000人守在直播间眼巴巴地等待比赛开始。中午12:00,比赛正式开始,YouTube视频播放量在直播开始(YouTube直播11:30开始)20分钟内就接近3万 。虎嗅将全程关注比赛(赛况直播综合自Youtube、 新浪 、 网易 )。


赛前YouTube评论板块


李世石开局不利


中午12点,棋赛正式开始,李世石执黑子,谷歌AlphaGo执白子。


对弈开始


开战一小时,双方在右上角陷入激战。第7手 (黑第4手) 时,李世石走了一步出人意料的棋,这一步在职业棋手中比较罕见的。曹大元说,如果是职业高手之间对阵下这一步,是要被批评的。曹大元表示谷歌人工智能比上次战胜欧洲围棋冠军樊麾时更强,而且从目前情况来看,白棋下得更好一些。


新浪直播嘉宾、中国棋院九段棋手俞斌认为李世石表现得比较急躁,不太有利。Youtube解说员、九段棋手麦克雷蒙也认为黑棋目前比较危险,并评价AlphaGo表现惊艳。同在解说现场的搜狗CEO王小川则表示,在足够复杂的局面下,机器的极限高于人。


77手,李世石首次离席。一般对手会等对手回来才落子,但电脑没有这样的“觉悟”,马上就落子了= =。


AlphaGo出现失常


开赛1小时40分钟左右,AlphaGo出现失误,但随即在86手时使出了凶险招数。Youtube解说、韩国金成龙九段评价:成为职业棋手27年来,第一次看到白86断这手棋!然而李世石看到断这步棋后,摇了摇头 (阿尔法狗被大师鄙视了233333)


图片来自新浪


古力九段此时分析,黑棋左下已经构成很具规模的地盘,右上边目数也比较大。而白棋如果不逃出左下局面被包围的两子,盘面将明显落后。而实战是李世石夹死了AlphaGo左下的两颗白棋,白棋选择在右边打入。目前右边白棋大龙虽长,但眼位明显比较缺乏。


棋局进行到现在,形势判断各方认为李世石优势。网易直播解说员、中国棋院九段棋手曹大元表示: 白棋现在有点失常。


重大失误后,李世石面露沮丧


开赛2小时30分钟,各方一度预测李世石稳胜。俞斌甚至说,接下去的看点就是机器会不会主动认输。


但随后AlphaGo似乎一直在制造变数,一通搅局后,黑棋已不具明显优势。将近3个小时,白棋50目左右,黑棋不算右下是55目,右下还未定型。不久,李世石右下出现失误,有评论员大呼不好,说李世石要输。


现场有人问金成龙李世石右下失误是否会影响胜负,金成龙说你不要套我的话,讲棋的只会说这棋好难好难啊,这种对弈需要大心脏,可是AlphaGo没有心脏,我也是人,得去下洗手间了。


比赛进行到3小时30分钟,俞斌宣布:这棋基本可以宣判了,如果是我们比赛研究室,在这个阶段,可以收子了。 李喆补充说:如果电脑不犯特别低级的失误,李世石基本输了。李世石似乎面露沮丧。


15:35左右,李世石宣布认输。 首战战败,李世石将面临巨大的心理考验,究竟最终胜负如何,虎嗅会持续关注。


李世石曾信心动摇


对于这场世纪大战,李世石 此前曾表示自己有信心获胜 。“我听说谷歌DeepMind的人工智能技术很强,而且还在提升,但我还是有信心的,我觉得至少这次可以赢。”但仅仅过了半个多月,李世石却对美联社表示:“ 但是如果人工智能继续发展,再过一两年,结果就很难说了。


而就在昨天,对弈“双方”在首尔举行了赛前最后一场记者见面会。李世石在记者会上表示,他认为到目前为止还是人类比人工智能强,“不过听到人工智能具有了类似人类的直觉判断能力,我倒感到有些紧张, 恐怕我以5比0战胜它有点儿够呛,因为人类下棋时会有失误。” (详见虎嗅文章 《和谷歌一样,李世石也认为人工智能击败人类围棋选手是迟早的事》


针对AlphaGo战胜樊麾一事,李世石认为,“阿尔法围棋此前与樊麾的对局应算业余中的顶级水平,并非职业水平。”他表示:“之所以接受机器的挑战,是因为听到欧洲冠军被击败感到震惊。如果我失败,可能会对围棋的流行造成影响, 但人工智能击败人类是不可避免的事情。


“阿尔法狗”有多厉害?


“深蓝”打败国际象棋世界冠军,已经给人工智能界带来了一次休克性的震撼。然而比起国际象棋,围棋要复杂得多,对比一下便知:国际象棋的第一步有28种下法,围棋有361种;国际象棋一局大约是40个回合,而围棋可长达150个回合。在“深蓝”时代,大多数国际象棋电脑依赖的依然是穷举法,即计算并评估所有可能的下法,然后从中选择对自己最有利一种,“深蓝”当时的运算能力是每秒计算2亿种下法。


但在围棋中,这种方法根本行不通。据科技媒体 Ars Techtica 报道,以当今计算机的运算能力,用穷举法来计算围棋下法几乎是不可能的事。另据 《卫报》 分析,即使穷举法下围棋可以实现,计算机每走一步都要耗费大量时间进行计算,这样下去根本连普通选手都下不过。这种困境,甚至使得一位知名围棋软件开发者在2014年放出话来:机器要战胜人类选手,恐怕要再等10多年。


AlphaGo已经以事实证明要不了那么久。与传统解决方案不同,AlphaGo人工智能程序结合了深度神经网络机器学习方法和树搜索算法。简单来说,就是先让AlphaGo观察人类下围棋,然后通过将不同决策进行比较来提升技能,这一过程被叫做强化学习。经上百万次重复后,AlphaGo就可以进行对战了。


谷歌DeepMind CEO Hassabis表示,用强化学习技术“教”机器下围棋,就如同教小孩子一样,不是让程序员添一段代码就完事,而是要给程序看足够多的案例,让机器自己“领悟”到正确的下法。


从一定程度上说,AlphaGo是在以预测的方式模拟人类的直觉,试图以人类的思维去学习围棋。 目前,AlphaGo模仿人类的直觉判断程度约为80%,但李世石此前表示由于它的运算速度要优于自己,所以要格外小心。


这种强化学习技术的应用,其实早已不局限于围棋。DeepMind曾用相同的技术教会计算机玩雅达利 (美国电脑游戏机厂商) 的经典游戏。另有 消息 称,DeepMind最近宣布与英国国民健康服务中心 (NHS) 合作,首个项目是为医生护士开发一款可以监测到病人是否出现急性肾衰竭的App


原来机器已经如此可怕,接下来的比赛,李世石还有雪耻的机会吗?

*文章为作者独立观点,不代表虎嗅网立场
关注微信公众号虎嗅网(huxiu_com),定时推送,福利互动精彩多

随意打赏

提交建议
微信扫一扫,分享给好友吧。