科普|人工智能、机器学习和深度学习有何不同?
人工智能代表了未来
人工智能只属于科幻小说
人工智能已成为我们日常生活的一部分
……
所有这些说法都是正确的
只是取决于你所说的是什么样的人工智能
早些时候谷歌Deepmind的AlphaGo击败了韩国围棋大师李世石。媒体在报道AlphaGo的胜利时,混杂使用了人工智能、机器学习和深度学习等多种术语。
实际上,这三方面技术都为AlphaGo的胜利做出了贡献。然而,这三项技术各有不同。
人工智能、机器学习、深度学习之间,到底有什么联系和区别?
这里,氦氪云准备了3000字为你解答。但如果你只想花两分钟搞懂,只看下面三段就OK了。
简单来说,三者之间关系就是这样的:
人工智能 (由机器诠释的人类智能)
小到手机上使用的图像识别软件,大到《钢铁侠》中的贾维斯,你都可以将其归在人工智能的范畴里。人工智能既可以是科幻,也可以是我们生活中的一部分;
机器学习(实现人工智能的一种方式)
这种方法的特别之处在于,它不是通过手动编写特定的程序来完成某项工作,而是借助海量数据进行训练,让机器自己学会如何完成任务,就像人通过积累经验来掌握一项新本领一样;
深度学习(一种实现机器学习的方法)
机器学习中有一种算法叫做人工神经网络,是指通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。深度学习是在人工神经网络基础上发展而来,通过建立大得多也复杂得多的神经网络,来获得更精准的效果。但这种方法需要消耗巨大的计算资源。深度学习现在这么火,和当今计算性能的飞跃有着密切联系。
人工智能最初可以追溯至1956年,当时多名计算机科学家在达特茅斯会议上共同提出了人工智能的概念。
在随后几十年中,人工智能一方面被认为是人类文明未来的发展方向,另一方面也被认为是难以企及的梦想。实际上,直到2012年之前,情况一直如此。
过去几年,人工智能实现了爆炸式发展,尤其是自2015年以来 。这在很大程度上是由于,GPU的发展使并行计算变得速度更快、成本更低、性能更强大。 与此同时,存储设备的容量变得越来越大,而我们正获得海量数据(即大数据的发展),无论是图片、文字、交易信息,还是地图数据。
回到1956年夏天的那次会议。当时人工智能先驱们的梦想,是构建具有人类智力特征的高级机器,这就是所谓的 广义人工智能,它拥有和我们人类相同或更多的感知能力、所有的理智,以及和人类一样的思考事物的能力。
在许多电影里,你都可以看到这样的机器成为人类的朋友,例如《星球大战》中的C-3PO,以及终结者。通用人工智能机器仍在电影和科幻小说中不断出现,但至少目前,我们还无法实现这样的人工智能。
(King me:一款西洋跳棋程序,作为人工智能的早期案例,曾在上世纪50年代引发一阵轰动)
我们能够实现的人工智能,可以认为是 狭义人工智能,它指的是能够完成某项特定工作、甚至完成得比人类还要好的技术, 比如Pinterest上的图像分类,Facebook的人脸识别等等。
简单来说,机器学习利用算法去分析数据、学习数据,随后对现实世界情况作出判断和预测。因此,与预先编写好、只能按照特定逻辑去执行指令的软件不同,机器实际上是在用大量数据和算法去“自我训练”,从而学会如何完成一项任务。
Spam free diet:机器学习为你清理收件箱中(大部分)的垃圾邮件
多年的研究结果表明,机器学习的最佳应用领域之一是计算机视觉。
以大家非常熟悉的「STOP停车标志牌」为例,人们需要编写边缘检测程序,以识别出物体的轮廓;编写形状检测程序,以识别出它是否有8个边;编写能够检测字母「S-T-O-P」的分类器……利用这些手动编写的分类器,可以开发出理解图像的算法并「学会」判定它是否是一个停车标志。
这这种方式看起来不错,但还不够好。因为如果遇上雾天,或者是被道路上的树稍微遮挡时,标志牌便会很难看清。这就是直到不久前,计算机视觉和图像检测还比不上人类的其中一个原因——他们太容易出错了。
Herding cats:从 YouTube 视频中挑出猫咪图片,是深度学习的首次突破性表现之一
人工神经网络已有几十年历史了,神经网络的灵感来自我们对生物大脑的理解——所有神经元之间相互连接。但是,生物大脑中,神经元可以在特定物理距离内连接到任何其他神经元,而人工神经网络中的层、连接和数据传播方向都是离散的。
比如,你可以把一个图像切成一堆碎片,然后输入到神经网络的第一层中。然后第一层中的那些单个神经元将数据传输给第二层,第二层再传给第三层……一直传输到最后一层并输出最终结果。
在这一过程中,每个神经元会有一个输入权重,或者叫加权值,用来评估其所执行的任务是否准确。最终的输出由所有这些加权值来确定。
依然以停车标志为例,现在我们可以把该图像的元素切碎,然后由神经元来对它的形状、颜色、字母、尺寸等等进行检查。神经网络的最终任务是推断出它是不是一个停车标志。在这个例子中,系统最终可能有86%的把握认为它是一个停车标志,7%的把握认为它是一个限速标志,5%的把握认为是挂在树上的风筝等等。
当网络正在进行调整或训练时会产生大量的错误答案,这对神经网络来说是一个非常好的机会,因为它所需要的就是训练。它需要通过数十万、甚至数百万个图像的训练,直到神经元的加权值得到精准调整,最终做到每一次都能产生正确的答案——无论有没有雾、有没有雨,都能看出那是一个停车标志牌。
这个例子看上去很好理解,但事实上,直到最近几年,神经网络都是被人工智能研究圈子避开的领域。 原因很简单,即便是最基本的神经网络,都需要巨大的计算资源支持。
2012年的ImageNet视觉识别挑战赛改变了人们的看法。多伦多大学首次利用GPU训练神经网络模型,一举将错误率从上一年的26%降低到16%并夺得冠军。这被认为是深度学习爆发的标志性事件,在后来的ImageNet中,GPU的使用也呈现爆发增长。
如今,在一些应用场景中,通过深度学习训练机器来识别图像,做得比人类更好,不仅仅是识别猫咪,还包括确定血液中的癌症指标、磁共振成像扫描中的肿瘤指标等。谷歌的AlphaGo被训练用于围棋比赛,它通过反复与自己对抗来调整自己的神经网络。
深度学习带来了机器学习的许多实用应用,拓展了人工智能的适用领域。深度学习系统将任务分解,让机器可以去完成这些任务。
利用深度学习,无人驾驶汽车、更强大的预防医疗,甚至更好的电影推荐都将成为可能。
人工智能代表了现在和未来。借助深度学习,人工智能将走过科幻小说阶段,C-3PO机器人和终结者将会成为现实。