人工智能如何一步步走来,直到挑战世界围棋冠军

钛媒体  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

   

图注:围棋的状态空间复杂度高达10^170,国际象棋的复杂度只有10^47

 

Google旗下的人工智能公司DeepMind开发的AlphaGo不久之前击败了欧洲围棋冠军,《Nature》杂志将以封面论文的方式报道这一人工智能领域的里程碑,意义不亚于1997年那场深蓝击败国际象棋大师卡斯帕罗夫的世纪之战。

3月,AlphaGo还将向世界顶级围棋选手李世石发起挑战。

正如外媒的评价,“1997年,当IBM深蓝计算机在象棋上称霸时,它使用的是手工编码的规则,在搜索时将穷尽所有可能发生的步法。Alpha Go从本质上则是随着时间而学习的,可以识别出可能具有优势的模式,然后模拟出数量有限的潜在结果。”

关于“奇点临近”的杞人之言又开始抬头,不过相比这些乍然爆出的人机对垒,已经润物无声地融入我们生活的Siri、Google Now等智能助手可能更有“存在感”。它们不是要与我们一较高下誓不罢休的对手,而是随时听遣,安排我们的日程起居,供我们调戏的助手。在《与机器人共舞》作者约翰• 马尔科夫看来,前者是志在取代人类的AI(Artificial Intelligence),后者是意在辅助人类的IA(Intelligent Augmentation),即使是Google这样的公司也会在被这两条不同方向的道路所撕裂。

比如, Google Now与Google Glass都是用来增强人类能力的工具,而无人驾驶汽车则是要从司机手中彻底接管驾驶权。它收购的Boston Dynamic机器人公司放弃了对人类智力的模拟,而是专注于做和人类四肢有同样灵活性、平衡性、适应性的无头Big Dog,而它的Google Brain项目则在学习像人一样识别一只猫。Body与Brain的分离及其后果在其无人驾驶汽车项目上体现的最为明显。

作为第一个报道Google无人驾驶汽车项目的记者,约翰• 马尔科夫在《与机器人共舞》中详细披露了坚持走AI路线的Google无人汽车遇到的问题:完全无人驾驶的汽车将陷入一种四向停车难题(four-way stop)。在没有红绿灯的路口,司机之间需要复杂的交流,而对于相互独立、互不连通的计算机系统来说,在可预见的未来想解决此类问题则更为困难。

借助于摄像头、多谱勒雷达、激光雷达等传感器,Google无人汽车能够对行驶途中的环境路况实时感知,然而车与车之间的数据共享与时时“沟通”目前看来仍然遥不可及,受限于无线通信标准、车厂合作、政府监管等原因,“车联网”在短期内仍然难以实现。更为棘手的是,司机经常会违背或忽略交通规则,而无人车与行人之间的意识“沟通”仍然是天方夜谭。

相比于对于“无人”概念如此执着到底的Google,很多其他公司取径更为现实的IA路线。比如,Mobileye无人驾驶汽车能让车上的乘客敏锐地感觉到机器援助的存在,更有公司采用眼球追踪、生物识别等技术来检测司机的注意力是否在方向盘上。

这对于也在跻身无人汽车大潮的Uber来说并不是个好主意,毕竟按照创始人Kalanick 的说法“Uber价格贵的原因就是司机的成本太高,如果没有司机的话Uber的的费用会大大降低。”

实际上,根据《与机器人共舞》一书的梳理,AI与IA两个阵营的竞争,两种价值观之间的碰撞自1960年代就在硅谷展开了。

1966年,在约翰麦卡锡带领斯坦福大学人工智能实验室启动制造模仿人类能力的人工智能项目的同时,在美国的另一边,麻省理工学院的马文明斯基与恩格尔巴特则启动了把计算机作为人类智力的延伸的智能增强项目,自此开始了半个世纪的花开两朵,各自生长。

在摩尔定律的号角声中,随着运算能力的几何量级飞升,当时的人工智能阵营被一股乐观的气息所笼罩——如果你感觉自己陷入困境,那么只需要等上10年时间,你的问题就定然能通过计算性能的提升而得到解决。在他们眼中,机器的视觉、听觉、推理能力等都可以通过计算能力的提升而迎刃而解。1978年,人工智能最忠实的信徒莫拉维克甚至在杂志上撰文:“再过10年,制作可以匹敌人类智慧的设备的硬件价格应该相当于目前一台大型计算机的水平。”

然而,他预想中的机器人时代并未到来,斯坦福大学虽然作出了一些基于“if then”逻辑的“推理引擎”并将各行各业的专家知识打包成包含600项思维规则的“指导手册”,然而这种需要人类去“input-out”的方式并不能让机器自己去认识世界,分析归纳,这并不是他们想要的思维机器(thinking machine)。

20世纪80年代,是“头脑中的自行车”的黄金年代,却也是相关公司接连倒闭的“人工智能的冬天”。

而IA阵营则成了人机交互的先驱,恩格尔巴特不只是大名鼎鼎的“鼠标之父”,更是图形化用户界面、超文本系统的先驱,从窗口、鼠标到自动助手、计算机,再到“对话式交互”,IA阵营基本上仍在恩格尔巴特最初规划的理论框架内发展。在他们的努力下,从庞然巨物到桌上电脑再到口袋玩物,从打孔纸到键盘鼠标、触摸屏再到语音助理、Magic Leap,机器成为一种愈来愈易用的人脑之延伸。

1987年预言了后来的iPad、 Siri的苹果Knowledge Navigator宣传视频中就虚构了一个系着领结的虚拟助手,然而14年后的Siri则不再有个人化身。实际上,在虚拟助手设计方面,化身一直都饱受争议。IA阵营的开发者们一直对“是否应该把这一系统变成聊天机器人”举棋不定。他们认为,没有人会坐下来和一个虚拟机器人聊上一整天,他们要做的,是设计一个系统来帮助人们管理自己忙碌的日常生活。呆萌的Siri“可调戏性”很差,而Google Now虽然已经智能到可以通过你的停留时间自动判断家庭与工作地,“非人化”则避免了给人以毛骨悚然、细思极恐的感觉。同样的微软的大眼睛曲别针Office 助手也因为太过“活泼”令人分神而被“下岗”。

实际上,这是IA与AI之间那条无形的线在其作用。

而随着全球互联网与海量大数据的出现,给了人工智能领域的另一支流——深度神经网络研究以大展拳脚的空间,机器的深度学习也成为可能,也让人工智能在两次冬天之后再次迎来爆发。《纽约时报》曾以《需要多少计算机才能正确的识别猫?16000台》为标题报道吴恩达领导的Google Brain是如何训练机器认识猫的,这需要Youtube上数以百万级的视频资料。语音识别、机器视觉、物体识别、人脸检测、翻译会话等领域的创业公司开始遍地开花。数十亿计移动传感器和计算系统——智能手机在源源不断地喂养、调教着一颗超级大脑,仿佛一张高速运转地神经网络。

AlphaGo所使用的神经网络结构示意图

而AlphaGo的挑战成功,是神经网络威力的最好证明,正如Google在博客中披露的:“传统的人工智能方法——构建搜索树来穷尽所有可能的位置——不可能挑战人脑。我们选择将围棋“分解”,用改进的搜索树算法结合深度神经网络开发出AlphaGo这一程序,通过将棋盘分解成包含数百万类似神经元的网络联接,划分为12个不同的网络层,其中的‘策略网络’(policy network)去选择落子,而‘价值网络’(value network)则负责预测对弈的胜者(计算局面)。我们让围棋高手训练AlphaGo程序走了3000万步,它预测对手下步棋的准确率达到了57%(之前的记录是44%)。为了击败而不只是模仿最好的棋手,AlphaGo还能够通过增强学习(reinforcement learning)在神经元之间对弈,调整网络连接,从而开发出新的策略。”

在人工智能阵营中,还有一帮人坚持着自底向上的路线:要想实现模拟生物智能的目标,就应该从制作人工昆虫这种最低层次的设备起步,模拟最简单的生物系统,而不是试图匹敌人类的能力,这就是仿生机器人(动物)。Boston Dynamic等公司所开发的机器猫、狗、豹等已经实现了“头脑简单,四肢发达”。协调性、适应性不亚于甚至超过了人类。

人工智能的Brain与Body都在快速成长,难怪微博中关于Boston Dynamic机器人最普遍的看法是:满脑子是以后人类被机器人毁灭的画面。

与此同时,AI与IA也在互相交融。Google Brain的研究成果已经被运用到Google Now等很多产品中,更准确地洞悉用户的信息输入,更人性化的理解人类的意图。微软发布的第一款智能助理Cortana显然比Siri、Google Now更加“人格化”——名字来自于《光晕》中的角色,虽然只是个圆形图标但却拥有16种表情,可以和你进行更自如机智的对话,而且声音更富有语调和感情。很显然,微软的目的就是让人们像爱上《Her》中的萨曼莎一样爱上小娜。

就像约翰• 马尔科夫在《与机器人共舞》一书的最后问到的那样:

人类已经将自己相当一部分的时间交给了与其他人类通过计算机互动,或是直接与一些类人的机器互动。这些人工智能化身将会成为我们的奴隶、助手、同事,还是三者的融合?

AI还是IA,这终将是摆在开发者与使用者面前不得不回答的问题。

                                         作者: 约翰• 马尔科夫(John Markoff)
                                         出版社: 浙江人民出版社
                                         译者: 郭雪
                                         出版年: 2015-11-16

随意打赏

提交建议
微信扫一扫,分享给好友吧。