人类最强大脑输给机器,不过是 AI 造福人类的开始
1 月 20 日,第四季的最强大脑落下帷幕,这季比赛由于选手当中新增加了一位特殊成员被备受关注,来自百度的人工智能机器人小度在一场三局「人机大战」中取得两胜一平的成绩,这个结果彻底碾压了三位代表人脑极限的人类选手。这三场比赛中的每个细节都成为社交媒体上热议的焦点,这些争议一方面是公众惊叹于人工智能如此强大,或将取代人类;另一方面也夹杂了太多阴谋论的想象,强调此次人机大战的不公平性。
如果说前一种缘由源自于于技术,特别是对人工智能发展的无知;那么后一种声音则不仅是对人工智能的无知,也是对人类自身存在和未来的无知,可谓愚蠢至极。
棋盘和人类大脑都是人工智能的标尺
事实上,尽管 2016 年人工智能领域如此火热,但从 2016 年 1 月到现在整整一年的时间,人工智能领域的震撼性事件只有三个:
• 2016 年 1 月 24 日,人工智能先驱马文明斯基离世;
• 2016 年 1 月 27 日,Google DeepMind 在《自然》杂志发表论文,正式宣布破解了围棋;
• 2017 年 1 月 20 日,百度人工智能机器人小度击败第三位人类选手,在三局人机大战中完胜;
之所以将上述三件时间、空间都没有关系的事件摆在一起,根本原因在于,这三个事件既是结束,也开启了一个属于人工智能的新时代。从 60 多年前开始,不管是明斯基还是另外几位人工智能的先驱,摆在这些最顶尖科学家、数学家面前的首要问题就是:如何衡量人工智能?
1920年代,美国心理学家 Louis Lean Thurstone 在研究中发现,受访者在回答问题时更倾向于回答一些相对意义或者比较意义的问题,比如类似这样的问题「你更喜欢谁的画,A 还是B?」就比单纯回答「你对A 画喜欢多少?」要容易简单的多。这套理论被称为「比较性判断准则(Law of Comparative Judgement)」。通过让人们每次比较多个对象中的两个,而最终可以计算出每个对象的测量分数(定距尺度)。
其运用范围非常广泛,人工智能研究者终于不再为定义「智能」来担忧了,只需要将机器与人类放在某个同样环境下继续比赛,利用人的智能来衡量机器的智能。棋类游戏首先被用于测试机器的智能,是因为棋类游戏是一种「完美」信息的游戏,对玩家们而言,无论人类还是机器,所面对的信息是透明且对等的——就是棋盘和棋子而已。
这样的暧昧情节始于1956年,IBM 工程师 Arthur Samuel 创造了一种西洋跳棋的应用程序,并使用强化学习来训练这个程序。1962年的时候,Arthur Samuel 的这个西洋跳棋程序打败了当时全美最强的业余选手 Robert Nealey。
接下来的最吸引人的两个故事就是卡斯帕罗夫与深蓝的世纪之战以及李世石大战 AlphaGo,借助于电视、互联网、社交媒体等大众传媒的发展,全世界的人都看到了东西方两大棋类里的顶级人物低头认输的场景。
人工智能已经在国际象棋、围棋证明了自己的能力,而挑战人类的最强大脑则成了衡量人工智能的另一个标尺。
此次最强大脑比赛,三场比赛涵盖了人脸识别、语音识别与视频(动态模糊图像)识别等多个领域。这些「技能」是人类长期进化过程所形成的,百度首席科学家吴恩达这样解释人类的人脸识别能力:「一个3岁的孩子看见妈妈时,不管妈妈是微笑、生气,睁着眼、闭着眼,长头发、短头发,穿什么衣服,孩子都可以轻易认出这是妈妈。」
更重要的是,人类的这种识别几乎是瞬间完成的,即便到现在,全世界顶尖的科学家也无法理解这背后的真正原理。而要让计算机拥有这种能力,科学家们在过去五十年里提出了诸多想法,但直到这几年,图像识别才真正实现了技术突破。
与图像识别相似,语音、动态图像识别的技术发展进程也经历了漫长过程,这些依托新算法的人工智能技术,究竟离人类大脑,特别是那些具备超强能力的人类大脑还有多大差距,这次比赛提供了一个最好的观察视角,而比赛结果也充分说明了人工智能在某些领域的已然超越人类。
当下人工智能只聚焦在特定领域
早几年的时候,李彦宏在参加《最强大脑》节目担任嘉宾后感言:「某些对于人类艰难的事情,对于电脑来说非常简单。」这话说得并不夸张,比如围棋这个领域,相比于人类棋手的成长速度,计算机的进化速度「令人窒息」,2016 年年底横扫中韩高手的 Master,也是AlphaGo 的进化版,要 Alpha Go 真正「进入职业棋届」不过一年多一点的时间,这种学习和进化速度是人类根本无法匹及的。
当下人工智能领域的火热得益于过去几年深度学习的崛起。最主要聚焦在三个领域:图像识别、语音识别以及自然语言处理。投资人David Kelnar提供了两幅图像识别和语音识别进化速度对比图:
以图像识别为例,在 2012 年的图片分类竞赛ImageNet 上,以深度神经网络为技术支撑的研究团队夺得第一,并将错误率降低到 20% 以下,让包括 Google 、Facebook 这样的巨头都震惊,随后,Google 买下了这个团队,也让深度神经网络「教父」Geoff Hinton 进入 Google 工作。在深度神经网络的帮助下,Google 的图像识别水平有了大幅提升,并将错误率降低到 10 %以内。
语音识别方面,在《麻省理工科技评论》评选的「2016年十大突破技术」中,基于语音识别的对话界面(Conversational Interfaces )成功入围,而要让人机对话有效,不仅要让机器听懂人的话,还要做出适当的反馈,《麻省理工科技评论》认为:百度硅谷实验室研发的语音识别引擎——「深度语音系统2」(Deep Speech 2),拥有一个大型深度神经网络,基于端对端的深度学习技术,可在数百万转录语言库的基础上学习如何将声音和语句联系起来,语音识别率精确度极高。目前的语音识别准确率为97%。
全球范围来看,语音识别技术已经达到临界点,由此也推动了语音合成以及自然语言处理方面的快速发展。比如基于语音合成技术,用户可以在百度多个产品里体验到与真人语音一样的合成语音,用户只需要按照要求和机器说50 句话,便可以让每个人拥有自己的声音模型,这项技术目前在手机百度小说频道取得显著成绩,用户听小说的时间从原来的 40 分钟提高到现在的将近两个半小时。
这就是当下人工智能所处的「历史地位」,历经 60 多年、几代人的努力,人工智能终于拥有了最基本的行为智能:
• 它可以下棋,但并非通过思考完成,而是对大量棋谱输入后,复杂计算的展示;
• 它可以回答问题,但不是学习形成的记忆,而是大量对文字、语音、图像等数据处理后反馈;
• 它可以挑战人类最聪明的大脑,却不具备触碰思考的能力;
最强大脑第三场比赛后,输给人工智能的人类选手王昱珩这样说道:「我决定回来的时候我也想过,我要想不败,我只要不战就可以了.....」这句话背后的潜台词,既有着当年卡斯帕罗夫、李世石失利后的某种不甘,也提出一个新的命题,面对这些特定领域的人工智能以及越来愈强大的机器,人机关系的重新定义和思考将变得越来越重要。
人工智能战胜人类的寓意
正如上文所言,任何一场人工智能与人类的比赛都不过是检验人工智能发展的标尺,换句话说,任何一场所谓的人机大战都有秀的成分。但这种秀的目的与是否能战胜人类无关,而是人工智能如何与人类相处的探索。
在马文明斯基晚年的重要著作《情感机器》中,明斯基则有力地论证了:情感、直觉和情绪并不是与众不同的东西,而只是一种人类特有的思维方式。也同时揭示了为什么人类思维有时需要理性推理,而有时又会转向情感的奥秘。他列举了人类的 19 种思维方式,以下列举其中的几项:比如「知道解决方式」、「类比推理」「简化法」、「理想化思维法」等等,你会发现,这些特性是人类独有的,机器根本无法学会。
换句话说,明斯基为人与机器之间划了一条分割线:让机器的事儿归机器负责,人类的事儿则由人类完成。这一理念影响了人工智能最近十几年的发展进程,让「人工智能智能增强人类智能」成为越来越多公司的共识,在几乎每一场人工智能战胜人类并充分展示人工智能的巨大潜力之后,这些技术逐步成为帮助人类发展的动力:Watson 击败人类选手后,开始将自己的智能输出给医院、酒店;Alpha Go 战胜李世石后,其技术逐步运用到 Google 其他产品中;而此次百度人工智能的胜利,事实上也为百度在未来人工智能落地提供了更多想象空间。
正如百度深度学习研究院院长林元庆所言,在当下人工智能开始出现泡沫的环境下,判断一家人工智能公司是否是真正的人工智能公司的标准是:是否在研发前沿技术,是否能将技术落地。就目前来看,百度人工智能落地方面有不少值得关注的场景,比如在刚刚结束的 CES 上,百度发布了「DuerOS」的操作系统,这是一个基于语音交互的操作系统,或者理解为人工智能操作系统。从官方透露的资料来看,DuerOS 更像是之前发布的度秘的升级版,只是将应用场景放在了B 端。
自动驾驶则是百度人工智能技术的集大成者,集成了包括环境感知、行为预测、规划控制、高精定位、高精地图等核心技术,这些技术的背后,离不开海量的交通数据、强大的计算能力和机器学习算法的改良和优化,也正是在上述技术的共同作用下,百度的无人驾驶产品具备了世界一流的水准。
写在最后
随着机器进化速度的加快,任何一场人机大战的结果都会让人们心生恐惧,人类长期以来的自我中心论心理的作祟,让这一切像极了机器即将替代人类的前戏,但类似的历史还出现在印刷术出现时中世纪、PC 大规模出现时的上世纪 80 年代.....而后面的历史则表明,这些技术、机器所带来的进步,远超人们的想象。
如果用一句万能语来结尾,或许这句再合适不过了:这是一个最好的时代,也是一个最坏的时代。2017 年刚刚开始,人机大战刚刚结束,接下来的人机关系以及人工智能的落地,或许更值得期待。