革命尚未成功,“Deep Learning”再次无缘Gartner技术成熟度曲线
雷锋网 (搜索“雷锋网”公众号关注) 按: Gartner技术成熟度曲线(Hyper Cycle)是Gartner著名并受到市场广泛认可的一项市场评估手段。它通过量化一个技术从诞生到进行成熟的产业化应用的阶段,形象的评估并比较了各个技术商业化的潜质的高低。Hyper Cycle将产品的生命周期划分为五个阶段: 创新触发点(Innovation Trigger)、期望过高的峰值(Peak of Inflated Expectations)、理想破灭的低谷(Trough of Disillusionment)、启蒙的斜坡(Slope of Enlightenment)、生产力平稳发展期(Plateau of Productivity) 。最近几年,Gartner将人工智能相关的一些词汇也加入到了这个表格中,不过在技术方面,它加入的不是近年来大热的深度学习,而是机器学习这个总的技术类别。
Gartner第22次发布了它经过了充分讨论的新兴技术成熟度曲线报告,这份报告旨在“为商业战略家、首席创新官、研发主管、企业家、全球的市场销售人员和新兴技术的研发团队等一切需要时刻掌握新兴技术动向的团队提供一份横跨整个产业界的关于技术趋势的透视图。” 图表如下:
在去年的技术成熟度曲线中,机器学习第一次出现在了图上,当时福布斯的专栏作者Gil Press评论道:
机器学习今年第一次出现在了这幅图表上,不过它直接跳过了第一阶段并越过了最高期望点。不过,一个很明显的地方是作为机器学习的一种新的标志性方法和新的思路的“深度学习”并不在这张表上。
去年的图如下:
可以看到,今年Gartner把机器学习的位置稍微向后挪了一点,把它放在了“期望过高”的最高处,并估计还有2-5年才能实现主流化应用,机器学习是否还是一项新兴技术,还有没有更好的词能概括它在当今技术中的地位?
机器学习是编程的含义从给电脑输入以一步一步具体的算法和规则组成的包含特定指令序列的程序到给电脑输入能够从数据中学到东西并根据这些东西“自我改善”的程序的转变的最好体现。算法会由被事先标记或分类好的数据进行训练,并且学会分辨新输入的没有标记和分类的数据属于之前见过的哪一类。比如说,在经过一段时间分析垃圾邮件和非垃圾邮件的训练之后,一个好的深度学习程序就能做到不用人类介入就能分辨哪些邮件是垃圾邮件而哪些邮件不是了。除了垃圾邮件过滤外,机器学习还在如手写识别、机器翻译、诈骗侦测和产品推荐上有许多成功的应用案例。
其实机器学习已经出现很长一段时间了。据维基百科的记载,早在1959年,Arthur Samuel就已经给出了机器学习的定义:“一门能让电脑不用特意编程就能自己学习的学科。”是的,它在1959年就已经出现了。很明显,一般来说,这个年代的东西我们都不太会管它叫“新兴技术”。
“人工 神经网络 ”和“深度学习”(以及其各种变种)是现今技术圈最新潮热门的词,我敢说比其他任何技术词汇都要流行。不过这些词也存在很长时间了,不过,Canadian Mafia和其他人过去十年间在使用专用处理器和大数据训练计算机方面玩出了新的花样,而其爆发的临界点伴随着两个突破性进展出现在2012年:谷歌的“Google Brain”团队的一个由16000台电脑组成的计算集群在处理了1000万张从 YouTube 获取到的图片后学会了辨认图片中的猫。在同一年,深度神经网络的错误率降低到了16%,并在ILSVCR(annual Imagenet Large Scale Visual Recognition Challenge,一个研究团队提交各自程序来识别图片中的物体和景色的比赛)中获得了相当大的进步。这种方法的快速进步展现已经在过去四年里让无数学者将他们的研究精力转移到了这上面,深度神经网络在其他领域的应用要求对未建模的数据的分析和处理。
深度学习不是机器学习领域唯一一个正快速进步的领域。 Pedro Domingos曾在演讲“The Master Algorithm”中提到过五个主要的实现方法,不过其各种各样的变种其实也很多。深度学习目前得到了最多的关注,尤其是年初的时候DeepMind Techonogies的围棋程序击败了世界上最厉害的围棋选手之一。不过事实上,其他的方法在解决其他类型的问题的时候可能表现的会比深度学习更好。所以可能只在这个图表中写上“Deep Learning”而忽略其他的方法真的不是个好主意。如果Gartner要用的话,可能用一个类似“先进机器学习(Advanced machine learning)”的词语来描述这些新兴科技,或者其他的属于机器学习范围的科技会比较好。
via Forbes
总结
深度学习的表现确实很好,但很明显,Gartner也不希望这一种方法垄断整个机器学习领域(更何况深度学习的运作原理目前还不是很清楚。)。所以Gartner在技术成熟度曲线中用了“机器学习”这个概括性的词,也为其他的机器学习方法留出了一种可能性。
而且,公众目前对人工智能的能力期望确实普遍过高,甚至有很多人认为终结者那样的机器人、或者奇点在几年内就会到来。Gartner也是捕捉到了这一点,把Machine learning放在了“期望值过高”的顶点,不得不说确实对市场相当了解。
所以,研究团队、投资者、创业者们如果想要在这方面有所建树,倒不如试着了解一下Machine Learning中的别的方法。说不定,它们中的某些方法在机缘巧合之下,就有成为下一个“Deep learning”的潜力。
题图来自visualstudiomagazine.com