谷歌程序打败围棋大师意味着什么?牛津大学说不过是AI能力冰山一角

创业邦  •  扫码分享

作者:卡德·梅茨(Cade Metz),《连线》杂志高级撰稿人,内容覆盖谷歌脸书、人工智能、比特币、数据中心、电脑芯片、编程语言,及其他改变世界的方式。

围棋是一项拥有2500年历史的策略智力竞技游戏,其复杂程度是国际象棋的指数级。就在前几天,谷歌人工智能(AI)程序将一位围棋大师斩落马下。而尼克·博斯特罗姆(Nick Bostrom)对此毫不惊讶。

博斯特罗姆是牛津大学一位瑞典裔哲学教授,他新近出版了一本题为《超级智慧:路径、危险、策略》的畅销书。书中描绘了AI的种种益处,但也认为真正的智慧计算机可能会加速人类的灭绝。这并不是说他低估谷歌围棋AI的能力。。他只是觉得这算不上是向前迈进的一大步。博斯特罗姆指出,包括深度学习(Deep Learning)和强化学习(Reinforcement Learning)之类广受讨论的AI技术在内,谷歌系统背后的技术多年来一直在稳步改进。谷歌AI打败围棋大师不过是AI能力巨大蓝图的冰山一角。AI缘起已久,且还将继续深入发展下去。

AI竞赛真不仅仅在于哪家公司的围棋技术更高明。

博斯特罗姆说:“我们最先进的人工智能技术,一直以来都在稳步发展。谷歌的底层技术极大承袭了过去几年一直在发展的技术。”

但若从另一个角度看,这也是为什么谷歌的成功如此令人振奋,乃至让人感到有点恐惧的原因。甚至博斯特罗姆都认为,是该停下来认真审视该技术的时候了。研究人员曾经以为,AI要称霸围棋至少还有十年的路要走。现在,它已经走到了过去看起来无法达到的地方。或者说,至少,很多有钱有权的人希望AI能够达到那种程度。

我说的不仅仅是谷歌,还有脸书、微软和其他科技巨头。创造最智慧的AI已经演变为真正的竞赛,参赛者就是这个星球上最财大气粗的人。谷歌的成功最有说服力的部分,可能就是脸书创始人马克·扎克伯格(Mark Zuckerberg)的回应。

打造神经网络,像人类大脑一样去学习

谷歌的AI系统名为AlphaGo,由谷歌在2014年初花4亿美元收购的AI研究公司DeepMind研发。深度学习和强化学习是让机器可以很大程度上自我学习的两种技术,DeepMind的专长就是这两种技术。之前,DeepMind创始人德米斯·哈撒比思(Demis Hassabis)和他的团队曾使用这些技术打造可以玩转经典阿塔里(Atari)视频游戏(如:乒乓、突破和太空侵略者)的系统。某些情况下,这些系统不仅能在竞技中胜出职业游戏玩家,还能以人类无法想象的方式把游戏玩得略显弱智。很明显,这就是促使谷歌首席执行官拉里·佩吉(Larry Page)买下该公司的原因。

神经网络是模拟人类大脑神经元网络的软硬件网络。驱动谷歌相册内置超高效图像搜索工具的,就是利用了神经网络的深度学习。脸书的面部识别服务、微软Skype语言翻译工具,以及推特色情内容识别系统也建立在深度学习技术上。如果你将数百万游戏动作反馈进深度神经网络,你就能教会它玩视频游戏。反馈进不同的数据集,可以教会神经网络执行不同的任务,从产生谷歌搜索引擎结果,到鉴别计算机病毒,不一而足。

强化学习又比深度学习更进一步。只要你建立起足以玩转某种游戏的神经网络,你就可以让它自己跟自己竞赛。同个神经网络的两个不同版本在经历千百次左右互搏之后,系统就会记录下能达到最高分的游戏动作,也就学会了在更高层级上玩这种游戏。同样地,这一技术不仅仅局限于游戏。它也可以应用到类似游戏的任何事务上,任何涉及到策略和竞争的事务都可以。

AlphaGo采用了所有这些技术。而且,远不止如此。哈撒比思和他的团队加进了第二层级的“深度强化学习”,可以前瞻到每一步游戏动作的长远结果。他们还依赖于在过去极大驱动了围棋AI的传统AI技术,其中就有基本上是从大量采样中收敛出最终结果的蒙特卡洛树搜索法。新老技术结合,DeepMind打造了一个足以打败顶级职业棋手的系统。去年10月,AlphaGo与连续夺得三届欧洲围棋冠军的围棋大师进行了一场关门比赛。这场比赛赛了5局,AlphaGo全胜。

围棋的复杂,让IT大佬们更加兴奋

这场胜利之前,很多AI专家都认为打败人类顶尖棋手是不太可能的,至少,这一天不会很快到来。最近几个月,脸书都在完善它自己的围棋AI——虽然投入的研究人员不像DeepMind团队那么多。上周,我们问负责脸书AI工作的深度学习之父延恩·勒昆(Yann LeCun):谷歌有没有可能已经秘密击败了围棋大师。他回答说这不太可能。原话是:“不。大概。不可能。”

问题在于围棋极其复杂。国际象棋中每一步有35种可选走法,而围棋是250种。一步步走下来,整盘棋的可能局面就是250的指数级。也就意味着,即使是最大的超级计算机,也无法看出每一步的可能结果。可能的选项实在是太多了。正如哈撒比思所说,围棋的可能布局比宇宙里的原子都多。想要破解围棋,就需要不仅仅只会计算的AI。这种AI得某种程度上模拟人类思维,甚至人类直觉。你需要能够学习的AI。

这也是为什么谷歌和脸书要解决这个问题的原因。如果他们能解决如此复杂的问题,就能够利用从中学到的东西作为跳板,创造出能解决现实世界中更为实际的问题的AI系统。

哈撒比思称,这些技术与机器人技术简直是“天作之合”。它们让机器人更好地理解所处环境,应对环境中的未知改变。想象一下能给你做菜的机器人,吃货福音有没有?不过,他也认为,这些技术或许会给科学研究增加压力,让AI助手指引了研究人员的研究方向。

而且,对AI的追求略过了一些能更快改变人们的日常生活的更直接的应用。DeepMind的技术不仅仅能帮助智能手机识别图像和语音,或者进行语言翻译,还能理解语言。这些技术就是通向能用自然语言进行互动的机器的路径——一个真正能用起来的Siri。

他们是认真的

所有这些都解释了为什么马克·扎克伯格要在谷歌宣布曾秘密打败围棋大师的几小时前如此急于谈论围棋。

谷歌的声明以研究报告的形式登载在学术期刊《自然》上,而脸书员工在《自然》正式刊出之前就看到了那篇文章(在保密协议下可以提前两天在记者中共享)。其结果,就是脸书导演了一场防灾控制大戏。

谷歌声明发表前夜,脸书AI研究人员发布了关于他们自己的围棋AI的全新研究报告——就其本身而言也是十分令人惊叹的成就,扎克伯格也用他自己的脸书账号为这一消息摇旗呐喊。他说:“过去6个月里,我们打造了一款能在0.1秒里就落子的AI,而且落子的智慧性与之前花费数年打造的系统不相上下。负责此项工作的研究员田渊栋就坐在距离我办公桌20英尺的地方。我喜欢让我们的AI团队待在我身边,这样我就可以从中学到点儿什么。”

别在意脸书的围棋AI没有谷歌的AlphaGo走得那么远。正如勒昆指出的,在围棋问题上,脸书的资源和时间投入都没有DeepMind那么多。我们尚不清楚为什么脸书会那么在意在谷歌消息公布日之前宣传自己的AI工作,但现实情况就是:脸书,尤其是扎克伯格,对这种类型的AI投注了巨大的关注,也由此,他们陷入了与谷歌的AI比拼之中,而谷歌,也恰好是他们最大的商业竞争对手。然而,这场AI竞赛,还真不仅仅在于哪家公司的围棋玩得更溜。谁能吸引顶级AI人才才是决胜关键。扎克伯格和勒昆都明白,他们必须向相对小众的AI社区证明,公司对AI是非常认真对待的。

有多认真呢?好吧,据说扎克伯格都在丈量他和田渊栋之间的距离了。在脸书内部,你的重要性体现在你的座位距离扎克伯格的远近上。是的,扎克伯格个人对此十分感兴趣。新年的时候,扎克伯格就说,他在2016年的个人挑战,就是打造一个能帮他处理家庭和工作事务的AI系统。

刀尖上行走

谷歌和脸书都有意打造能各方面胜过人类智慧的人工智能。但他们绝不是仅有的两家。微软和推特,还有埃隆·马斯克(Elon Musk),以及其他很多人,都在涌向这个方向。对AI而言,这是件好事。但对尼克·博斯特罗姆,好吧,还有埃隆·马斯克这样的人而言,多头竞争的场面就太惊悚了。

深度学习初创公司Skymind的创始人兼首席执行官克里斯·尼克尔森(Chris Nicholson)指出:由围棋展现出的那种AI可以应用到几乎任何能被看做竞技的问题上——也就是策略占主导地位的问题上。这类问题的典型例子就是金融交易,以及,战争。两个例子都要求更多的工作和更多的数据支持。但这个想法本身就已经十分令人不安了。博斯特罗姆的书提出:AI可能比核武器更危险,不仅仅因为人类可能误用AI,也因为我们可能会造出连我们自己都某种程度上控制不了的AI系统。

对于像AlphaGo这样的系统来说,这种情况的发生率是微乎其微的。是的,这个系统能自我学习——通过自己跟自己下棋来产生自己的数据和策略。是的,它能赢过大多数围棋玩家(与全球最佳棋手的大决战依然在我们的期待中)。但,即便围棋的世界已经万分复杂,它也只是一个有限的领域——与真实事件的复杂度没有可比性。而且,DeepMind的研究人员完全控制了整个系统。他们可以随意改变或关停AlphaGo。事实上,把这台机器视为威胁没有任何意义。

我们的担忧在于,随着研究人员持续不断地改进此类系统,它们不知道什么时候就会突破末日焦虑开始酝酿的阈值。博斯特罗姆称,他和他的人类未来研究所里的其他人,正在探寻强化学习脱离研究人员控制的方法。他说:“同样的问题,今后,或许会在更为复杂,但与今天的系统一脉相承的系统中出现。”已经有一些小小的迹象表明,强化学习有可能导致机器拒绝被关停的情况出现。

但这些迹象都很小。博斯特罗姆承认,这样的危险还很遥远,是否终将来临都还是未知数。幸亏有了他和埃隆·马斯克等具影响力的专家的努力,更广阔的业界得以早早理性面对这一潜在危险。最重要的是,这些关注和担忧表明,DeepMind研究中的这些技术是极具能力,极其强大的。

谷歌的围棋AI胜利表明了同样的东西,但那不过是个序曲。3月,AlphaGo将挑战雄霸棋坛十年的世界顶级围棋手李世石。这显然将是一场更为重要的比赛。李世石明显比伦敦人机大战中输掉的欧洲冠军樊麾更有才。樊麾世界排名633位,李世石则是第5位。很多专家都认为,AlphaGo将赢得这场重量级的较量。如果结局果真如此,好吧,这依然仅仅是段序曲。

(翻译:nana,编辑:picar)

随意打赏

提交建议
微信扫一扫,分享给好友吧。