AI火爆,但你知道人工智能、机器学习和深度学习有何不同?
【AI世代导读】
人工智能代表了未来。
人工智能只属于科幻小说。
人工智能已成为我们日常生活的一部分。
所有这些说法都是正确的,只是取决于你所说的是什么样的人工智能。
今年早些时候 谷歌 ( 微博 )Deepmind的AlphaGo击败了韩国围棋大师李世石。媒体在报道AlphaGo的胜利时,混杂使用了人工智能、机器学习和深度学习等多种术语。
实际上,这三方面技术都为AlphaGo的胜利做出了贡献。然而,这三项技术各有不同。
英伟达 官方网站近期刊文,介绍了人工智能、机器学习和深度学习概念的区别。英伟达的GPU(图形处理芯片)目前被广泛用于人工智能研究。“AI世代”(微信号:tencentAI)进行了翻译整理。
下面这个图表可以直观地看到这些术语之间的关联。其中,人工智能的范畴最大,机器学习次之,而深度学习最小。但实际上,深度学习推动了今天人工智能的大爆发。
从不被看好到快速发展
人工智能最初可以追溯至1956年,当时多名计算机 科学 家在达特茅斯会议上共同提出了人工智能的概念。在随后几十年中,人工智能一方面被认为是人类文明未来的发展方向,另一方面也被认为是难以企及的梦想。实际上,直到2012年之前,情况一直如此。
过去几年,人工智能实现了爆炸式发展,尤其是自2015年以来。这在很大程度上是由于,GPU的发展使并行计算变得速度更快、成本更低、性能更强大。与此同时,存储设备的容量变得越来越大,而我们正获得海量数据(即大数据的发展),无论是图片、文字、交易信息,还是地图数据。
让我们来看看,计算机科学家是如何推动人工智能从一项不被看好的技术发展成为被数亿用户使用的多款应用。
人工智能:来自机器的人类智能
回到1956年夏天的那次会议。当时,人工智能行业的先驱提出开发复杂的机器,使其具备人类智能的特征。这一概念被我们称作“通用人工智能”。这样的机器具备人类全部的感知能力(甚至更多)、逻辑推理能力,能像人类一样去思考。在许多电影里,你都可以看到这样的机器成为人类的朋友,例如《星球大战》中的C-3PO,以及终结者。通用人工智能机器仍在电影和科幻小说中不断出现,但至少目前,我们还无法实现这样的人工智能。
目前我们所能实现的是“狭义人工智能”。对于特定任务,这样的技术能做得像人类一样好,甚至更好。这种人工智能的范例包括Pinterest的图像分类服务,以及 Facebook 的人脸识别功能。
狭义人工智能具备人类智能的某些方面。那么,这些智能来自何处?这就要说到我们的下一篇章:机器学习。
机器学习:带来人工智能的方法
简单来说,机器学习利用算法去分析数据、学习数据,随后对现实世界情况作出判断和预测。因此,与预先编写好、只能按照特定逻辑去执行指令的软件不同,机器实际上是在用大量数据和算法去“自我训练”,从而学会如何完成一项任务。
机器学习的概念来自于人工智能发展的早期。随后多年中,基于算法的方法包括决策树学习、归纳逻辑编程、聚类算法、强化学习,以及贝叶斯网络等等。正如我们所知,这些技术最终都未能形成通用人工智能,而早期的机器学习方法甚至也没有带来狭义人工智能。
多年的研究结果表明,机器学习的最佳应用领域之一是计算机视觉。不过,计算机视觉技术仍需要大量人工编程才能实现。需要人工编码的技术包括,用于识别照片中对象边缘的边缘探测滤镜,用于判断形状的形状识别算法,以及用于识别字符,例如“STOP”的分类器。利用这些人工编码的分类器,算法可以理解图像,判断这是否是停止标志。
这种技术很强大,但还不算完美。例如在雾天,路边标志很可能看不清楚,而行道树可能也会遮挡标志的一部分。直到最近,计算机视觉在识别图像时一直无法达到人类的水平,这样的识别技术太脆弱,出错率太高。
不过,正确的学习算法将可以带来不同。
深度学习:实现机器学习的技术
机器学习专家们早期提出的另一种基于算法的方法,即人工神经网络,随后得到了发展。神经网络的概念来自于人类大脑理解事物的方式:神经元之间的互联。然而,与神经元紧密联系在一起的人类大脑不同,人工神经网络由离散的分层、连接,以及数据传播方向构成。
例如,你可以拍摄一张照片,将其分成多个小块,并输入神经网络的第一层之中。随后,第一层神经元将会把处理过的数据传递给第二层神经元。第二层神经元去完成自己的处理任务。这样的处理一直持续至最后一层,以输出最终结果。
每个神经元都会为输入信息赋予权重,即对于正在执行的任务,正确或错误的可能状态。最终输出结果基于对所有这些权重信息的相加。以停止标志为例。标志图片将会被分割,并由神经元去“分析”,包括整体形状、颜色、字母、尺寸,以及移动情况。神经网络的任务是判断这是否就是停止标志。为此,神经网络将基于权重信息得出“可能性向量”。在我们的示例中,神经网络认为,这有86%的可能性是停止标志,有7%的可能性是限速标志,5%的可能性是卡在树上的风筝。随后,网络架构师会告诉神经网络,做出的判断是否正确。
人工神经网络在人工智能的诞生早期就已出现,但在“智能性”方面一直未能取得太大突破。问题在于,最基本的神经网络也需要大量的计算资源,因此很难实现。不过,由多伦多大学的吉奥夫里•辛顿(Geoffrey Hinton)带领的一个小型研究团队持续地进行这方面的尝试,最终找到了一种可以由超级计算机运行的算法,证明了这一概念。然而,直到GPU开始大规模部署之后,这种技术才得以普及。
回到停止标志的例子,人工神经网络仍然很有可能得出错误的答案。这种神经网络所需的是训练。只有通过数以十万计,甚至百万计的照片进行训练,神经元对输入信息的加权才能足够精确,从而持续得出正确的结果,无论是否有雾,是否下雨。只有在达到这种程度之后,神经网络才能自行判断停止标志应该是什么样。实际上,2012年,人工智能专家吴恩达在供职于谷歌期间开发了神经网络系统,成功识别出小猫。
吴恩达取得突破的方法是扩大神经网络的规模,增加更多的分层和神经元,并利用海量数据对系统进行训练。吴恩达的研究利用了1000万个YouTube视频。由于神经网络分为很多层,因此吴恩达强调了深度学习的“深度”。
目前,基于深度学习的图像识别技术在某些情况下甚至比人工做得更好,而识别的对象也不仅是小猫,还包括血液中癌症的指标,以及核磁共振中的肿瘤迹象。谷歌AlphaGo学会了围棋游戏,并利用神经网络自我对弈,逐渐变得非常强大。
深度学习引领人工智能的未来
深度学习带来了机器学习的许多实用应用,拓展了人工智能的适用领域。深度学习系统将任务分解,让机器可以去完成这些任务。利用深度学习,无人驾驶汽车、更强大的预防医疗,甚至更好的电影推荐都将成为可能。人工智能代表了现在和未来。借助深度学习,人工智能将走过科幻小说阶段,C-3PO机器人和终结者将会成为现实。(编译/AI世代 李玮)
推荐:关注“AI世代”微信号(tencentai),穿越时空30年,进入机器人的时代。