谷歌围棋AI有科学欺诈表现的三个重要原因
作者:刘锋 计算机博士,互联网进化论作者,人工智能学家主编
”把大象关进冰箱要几步“涉及的科学漏洞
在讨论谷歌围棋AI及其比赛问题之前,我们先看那个著名的笑话“把大象关进冰箱要几步“,2000年中国春晚,赵本山、宋丹丹的小品《钟点工》,曾经用到了这个笑话:问“把大象放进冰箱总共分几步?”答:“三步,第一步把冰箱门打开;第二步把大象放进去,第三步把冰箱门带上”。
小品中的情景只是一个笑话,从科研角度看,因为故意忽视最为关键的第二步,使得这个原本伟大的科学实验,变成了笑话段子。本文提出谷歌围棋AI及其比赛有科学欺诈表现,根源也在这里。
谷歌围棋AI在Nature上究竟说了什么
谷歌在Nature发表论文阐述了其围棋AI程序AlphaGo的运行原理,这个原理描述相对专业,这里我们也力争用通俗易懂的语言描述谷歌究竟说了什么,谷歌围棋AI程序AlphaGo在下棋过程中主要通过四步完成工作,它们分别是:
第一步快速判断:用于快速的观察围棋的盘面,类似于人观察盘面获得的第一反应
第二步深度模仿 :AlphaGo学习近万盘人类历史高手的棋局来进行模仿学习,用得到的经验进行判断。这个深度模仿能够根据盘面产生类似人类棋手的走法。
第三步自学成长:AlphaGo不断与“自己”对战,下了3000万盘棋局,总结出经验作为棋局中的评估依据。
第四步全局分析:利用第三步学习结果对整个盘面的赢面判断,实现从全局分析整个棋局。
判断欺诈的第一个原因,谷歌的把大象关冰箱问题
Nature论文阐述的AlphaGo基本原理,按照人工智能专家的评价:”其基本原理并没有新东西“,但核心价值是学习了近万盘人类历史高手的棋局,和自我对战下的3000万盘棋局总结的经验。
请注意,这个关键内容,也就是AlphaGo到底终结出什么围棋规律,或者其神经网络的权重值是什么,谷歌并没有发表出来。也就是谷歌在”大象关进冰箱要几步“问题上,说出了如何打开围棋战胜人类的冰箱大门,和如何关上围棋战胜人类的冰箱大门,但唯独在第二步 围棋如何战胜人类的方法塞进冰箱,同样做了隐藏。
我们知道,围棋之所以很难被人工智能攻破,战胜人类高手,就是其可能的组合数异常庞大。至于多么异常,2016年1月普林斯顿的研究人员给出了最新研究结果:对于一个19x19的围棋棋盘而言,一共有361个位置,而每个位置可以单独放置黑棋、白棋或者留空,理论上所有的可能组合是3^361种。但根据围棋规则,不是所有位置都可合法落子,例如在围棋术语中没有气的位置就不能落子。那么排除掉这些不合法的棋局后总共还剩多少种呢?
普林斯顿的研究人员给出的19x19格围棋的精确合法棋局数:208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935
我们给它多分几行:
2081681993819799846
9947863334486277028
6522453884530548425
6394568209274196127
3801537852564845169
8519643907259916015
6281285460898883144
2712971531931755773
6620397247064840935
不用数了,一共171位数! 这个数字比我们地球所有的沙粒数量还要多!比人类已知宇宙的所有星球数量还要多!对比一下,谷歌学习的近万盘人类棋局是5位数,谷歌自行对战的3000万盘是8位数。而围棋所有可能的棋局盘数是171位数。如果规避还有可能的重复变化,我们把大头去掉,那也有70位数的棋局变化。
第一也就是说谷歌以幼儿园规模的知识量,就要获得诺贝尔奖级的知识规律,这是违背科学发展规律和常识的,第二,如果谷歌通过学习和自行对战学到了超出寻常的规律,或者其神经网络权重值达到新的高度状态。但谷歌不愿意公开这个最重要最关键的内容,其他研究者就无法真正了解谷歌围棋的真实水平。在这种情况下,匆忙举办获得巨大商业利益,没有第三方真正监督,无法洗脱作弊嫌疑的世界冠军比赛。受到科学欺诈指控也属必然。
判断 欺诈 的第二个原因,密室实验与棋手放水
从科学实验的严谨性说,谷歌在论文中阐述的实验方法,表现不及格甚至恶劣,我们知道在物理,化学,生物,计算机等领域,进行实验时,要求实验对象必须达到一定数量,并进行多次独立实验。才能相对确保结果的稳定性和可靠性。譬如一个受到污染的试管,无论我们重复多少次实验,其结果也一定是不可靠的。
谷歌在这篇论文中 对其他围棋程序选取了众多测试对象,并进行了495次实验,但对人类测试者,却只选取了一位曾经获得欧洲围棋冠军的棋手,并签署严格的保密协议,原本可以很容易邀请更多选手,但却没有按照科学规范进行多次实验。先不谈谷歌和棋手之间有无利益交易,就这一点,谷歌在Nature发表的论文从实验角度是不合格的。
更重要的问题出在与谷歌对战的欧洲围棋冠军樊麾身上,在对战棋谱公布后的二个月里,大量职业围棋高手含蓄或公开指出樊麾水平发挥失常,或不求进取,或就是放水。
多次战胜李世石,当前世界最优秀的围棋选手柯洁评价道:“他可能也是好久不下棋了,实力表现非常糟糕”。前北京市高校围棋冠军王烁在财新发布的文章中评价道:“这五局棋下得反而是很平庸。樊麾抵抗不足,五盘棋没有什么激烈的战斗,开局、定式、占大场、小规模接触战,收官,对抗度很差。”
虽然欧洲围棋冠军樊麾多次辩解“我发挥失常,当时崩溃了“,但更多棋友评价欧洲围棋冠军樊麾,“发挥有技术变形”,“樊麾的表现只有业4水准,关键地方明显放水”,“很明显樊麾是谷歌公司的托,全是50年前的招法极其保守,不输才怪”,“对于谷歌,没有什么谎言是不能用1千万美金解决的”。
除此之外,谷歌也没有向Facebook那样把围棋程序放到互联网上,光明磊落的接受大众的考验,作为与谷歌AlphaGo原理相同facebook围棋程序DarkForest,目前水平相当于业余5段,与职业选手依然有巨大的差距。
同时谷歌的论文结论也存在不可重复问题,Facebook围棋项目负责人田渊栋在评价谷歌围棋AI最为关键的快速走子策略时讲到”对此AlphaGo只提供了局部特征的数目,而没有说明特征的具体细节。我最近也实验了他们的办法,达到了25.1%的准确率和4-5微秒的走子速度,然而全系统整合下来并没有复现他们的水平。我感觉上24.2%并不能完全概括他们快速走子的棋力,因为只要走错关键的一步,局面判断就完全错误了“。
从上述情况看,谷歌围棋实验刻意违反科学规范,采用密室孤立实验,这些问题在3月9日与韩国选手李世石的比赛中没有消除。人们常说,互联网上,你不知道你的对面坐的是人还是条狗。同样对于谷歌围棋比赛,我们完全可以质疑,与李世石对弈的究竟是程序还是人?如何保证李世石没有被利益收买?谷歌即使不赢,其实也是胜了,鲁迅的那个故事,乞丐:赵老爷今天打了我。
判断 欺诈 的第三个原因,过度追求市场影响与提高股价
谷歌选择欧洲围棋冠军和前围棋冠军李世石进行世界轰动的比赛,而且没有严格的第三方监督,排除作弊的可能,表明谷歌并不是追求科学的严谨和荣誉,而是在追求品牌和影响力最大化,从而获得巨大的经济利益。
事实也证明这一点,2016年1月28日曝出了谷歌人工智能围棋击败欧洲冠军的消息,随后是谷歌拿出100万美元作为奖金挑战李世石。当日谷歌股价大幅上涨,涨幅4.42%,换算成市值涨了200亿美元。从宣传效果是看,谷歌这次的“广告”做非常巧妙。2016年2月26日彭博社报道,谷歌旗下人工智能公司DeepMind正推进自身医疗技术发展,因为其在围棋领域的影响,已经获得不菲的订单。
谷歌的技术期货路径和消除欺诈指控的方法
西方谚语说”一个动物,如果它走起来像鸭子 叫起来像鸭子 它就是鸭子“,同样,对于谷歌围棋Ai及其比赛,如果它回避公开如何从3000万盘(8位数)棋局获得171位天文数字棋局的规律或神经网络权重值,回避不愿大范围邀请棋手参与实验,回避收买选手嫌疑,回避不在互联网上公开对战接受监督,那么谷歌的围棋比赛可以看作一场精心策划的科学骗局或有欺诈嫌疑。
商业中有一种做法叫产品期货,消费者购买商品后,要等到半年或一年后才能拿到,那时技术,原料成本大幅下降,商家因此获得利润。同样,谷歌的围棋程序应该获得一定进展,但远没有到达能够挑战职业选手或九段高手的地步,谷歌通过市场和技术手段,拔高其围棋水平。故意回避公开监督或公开大范围对战。等待未来水平继续提升后,可能会进行公开,这种做法也可以称作 ”技术期货路径。
谷歌可以消除欺诈指控的嫌疑,不是与李世石下棋,而是:
1.完整公布或开源其利用3000万盘棋局和学习人类棋谱总结的规律,或公开其神经网络权重值参数,让其他实验者可以重复谷歌的实验结果,还原谷歌对战成绩。
2.将谷歌围棋AI程序AlphaGo放在互联网上,接受百人,千人的同时对战。并检测对战结果,消除作弊嫌疑。
这两条谷歌能做出任意一条都可以看作是消除欺诈指控的强有力证据,但在未来一年或更长时间里,谷歌没有任何动作,那么谷歌将持续背负有科学欺诈嫌疑,利用科学炒作获得巨大经济利益的指控。