王小川预测AlphaGo将完胜李世石:算法没有天花板

钛媒体  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

明日,“人机世纪大战”即将打响,韩国世界冠军李世石九段对战谷歌AlphaGo。此前 AlphaGo击败了欧洲围棋冠军樊麾,而李世石是近十年斩获世界冠军最多的棋手。在一些专业人士看来,虽然人工智能终究有一天会战胜世界顶尖旗手,但这个时代没有到来,明天AlphaGo很难战胜李世石。

不过在一个月前,搜狗CEO王小川知乎上发表评论,王小川认为,谷歌人工智能AlphaGo将完胜职业围棋手李世石。

王小川说,AlphaGo的发布,是一个伟大的里程碑,深度学习的魅力在于只要一个领域里能够建模,并有充足的数据,就能够在这个领域里让机器做到超越人、取代人。王小川还大胆预测,3月与韩国九段棋手李世石对弈,AlphaGo依然会完胜。“除了围棋,人工智能在其他博弈类的封闭游戏里,也会横扫一切,完胜人类。”

以下为王小川知乎全文:

AlphaGo的发布,是一个伟大的里程碑,又一次让我兴奋得需要说一说。

先说我的断言一:AlphaGo在两个月后,将会完胜李世石。

留个关子,本文最后再说断言二。

从中学开始,我就着迷用算法来解决游戏的博弈问题,用搜索方法创新性完成过一些题目。这几年深度学习出现后,就感觉有机会能够突破围棋,和清华的联合实验室做过几次探讨,都认为这个方向可行,可惜限于气场和能力不足,没能组织进行这方面的投入。

而此次出手的,是Google旗下的DeepMind团队,在深度学习方面是最顶尖的,资源、能力、气场都没有问题,突破性的技术是基于深度学习进行估值和走棋。

看知乎里好多讨论,是从之前AlphaGo完成的棋局来判断其下棋风格,倒推这个算法的威力,有点刻舟求剑的感觉。我们核心还是要回到对这次AlphaGo用到的技术的深刻理解。

为了便于讨论,我们对比以搜索剪枝为核心的深蓝下国际象棋,和以搜索剪枝+深度学习为核心的AlphaGo的三个区别:

1.围棋相对象棋,最大的区别是棋局的评价函数极难定义。象棋可以找到各种“特征”来计分,比如丢一个马扣多少分,兵往前拱到离底线近了加多少分,而围棋做不到,密密麻麻的黑白子挨着,互相之前又有关联,变化多,规律难以总结。这也是传统算法相对人最弱的几个问题之一。

就像是我们人做人脸识别,看一眼就知道是张三李四,而机器算法难以下手。这个问题恰恰是最近几年深度学习最大的突破之处,深度学习不需要人来设计算法“找特征”,通过大量原始数据和标签的积累,机器就能够自动找特征,并且并不比人差。

在几年前还有很多人认为机器在图像处理方面举步维艰,怎么定义和抽象鼻子?耳朵?眼睛?可就在这一两年深度学习突飞猛进,一举超过了人类。就在2015年,人脸识别方面,机器的识别能力已经超过了人了,这可是人进化了数千万年的核心能力之一呀。

一个围棋棋局,可以理解为一张19*19的图片,其他的走棋规则和非常简单(很容易翻译成计算机规则),正好落入了深度学习擅长的事情。

搜索+深度学习,这个算法完全可以覆盖围棋的规则,人下棋的思维过程和模式,只是AlphaGo的一个子集。这就决定了这个算法没有天花板,有机会在围棋领域“打通关”。

2.深蓝相对AlphaGo,AlphaGo最大的优势是“学习能力”。深蓝的开局更多依靠数据库棋谱的建立,但没有泛化能力(不懂得举一反三),对于没有见过的走棋方法就可能犯傻。而之后的核心能力是计算力,通过暴力的搜索(当然也有最优秀的剪枝,但还是暴力),力图走出10-20步棋来选择最优的路径。

这个复杂度是指数级的,变成一个NP问题,受限于计算力。这个系统的算法是写死的,固定的参数下,就会有固定的表现。而调整参数和改变算法,都是工程师的事情。这个系统的天花板是计算机有多强,以及工程师有多聪明。

而AlphaGo更多是数据驱动的,喂给他更多的棋局数据,他就能够优化“神经元网络”,同样的运算资源下变得更聪明,并且具有举一反三的能力,这一点非常接近于人(或者说本身就是模拟人的方式来设计的)。

而且我们知道,机器处理数据的能力足够地快,以及没有情绪不会出错,这就决定了这个系统如果把今天互联网上能收集到的棋局都学一遍,就成为顶尖高手了。

3.最最最可怕的还不只是前面这两点,对于下棋博弈问题,AlphaGo还不只是从互联网上去收集数据进行学习,更可以自己和自己下,实现“自学习”。看过电影“超验骇客”没有?

人工智能可以做到随着时间的推移就能更加聪明。金庸小说中老顽童让自己左手和右手打架“左右互搏”,成为天下无敌的武功,那个只是故事,在下棋这个领域,而AlphaGo有这样的设计,让这种武功成真了!

往下还有两个月的时间,AlphaGo这样一台算法上没有天花板的机器,很有机会在“左右互搏”下登峰造极,成为不可超越的围棋高手。

AlphaGo的技术问题讲完了。怎么来看Google背后的完整动作呢?有人觉得是过度解读了,实际系统挺糙的——选的都是“欧洲冠军——说明系统并不行,这是一种错误的理解。

更有可能的原因是Google和Fackebook在竞争下围棋,Fackbook的员工缺心眼提前放了好多消息出来泄密了,结果Google就赶紧把Nature的文章发了抢了个先,然后卖个期货两个月后和人类对决,那会儿系统就足够好了,这是在竞争环境下合适的做法。

事实上Google和Facebook两家都认识到了AI的重要性,以及就在最近几年会有大的突破。

Google 4亿美金收购了DeepMind,当时只有20人,现在已经突破200人了,并且是不计代价的疯狂投入。

下围棋只是体现人工智能进步绝佳的宣传点和切入点,从公开的文献可以看到,DeepMind做围棋研发是基于通用的技术进行,领域无关的(Domain independent)。这样的技术未来可以用到合适的其他领域里去。

深度学习的魅力在于,只要一个领域里能够建模,能够有充足的数据,就能够在这个领域里做到超越人、取代人,短时间能从0分做到99分。

如果我们依然是老观念,用渐进的方式来理解机器智能,比如之前某位大佬宣传他家的XX大脑做到了X岁的智力,这是很误(che)导(dan)的。我们同样也会错误地估计下围棋方面机器的能力,按照人类的理解1D-9D来评价它。

一句话,不要用评价人的方法来评价机器的人工智能的能力,完全是不同的模式。

老罗曾经评价过人工智能的一句话:“人工智能就像一列火车,它临近时你听到了轰隆隆的声音,你在不断期待着它的到来。他终于到了,一闪而过,随后便远远地把你抛在身后”。

如果给这句话打上一个补丁,把人工智能的应用局限到一个一个的具体的封闭领域,这是一个很贴切的描述。我们不要过度自大,例如我们容易在自我优越感的驱使下,说动物不如人,比如人会直立行走、会说话、会实用工具,以区别于其他动物。事实证明,动物也会。

面对机器也一样,就在几个月前还有人叫嚣机器十年内不能够玩转围棋,理由也都是人一眼就能看明白,机器只会计算。这些自大会让我们误判。也不用过于自卑,觉得围棋上机器上胜利了人类整个智力就被碾压了,到今天机器还是有很多领域完全无能,只能在局部领域。

到结尾,再说断言二:除了围棋,人工智能在其他博弈类的封闭游戏里,也会横扫一切,完胜人类。

随意打赏

提交建议
微信扫一扫,分享给好友吧。