艾瑞咨询分析师林仁翔:人工智能产业解析
编者注:本文根据主题为「人工智能为什么那么火?」的艾瑞互听会上,艾瑞咨询分析师林仁翔「人工智能产业解析」的演讲速记整理而来。
人工智能是什么呢?从我们的角度定义,就是让机器人实现本来人类智慧所完成的任务,比如视觉识别,看到物体,听懂语言,把语言转化成文字,甚至做自动推理,模拟人类学习和思考的过程。
人工智能的基础
通过对大量的数据计算和处理,机器人才能完成原本人类才能完成的任务。大家比较熟悉的是前一段时间 AlphaGo 与围棋选手李世乭对弈的事情。如果要穷举围棋的可能性,有 10 的 360 次方种可能性,这什么概念?人类目前可观测的范围内的氢原子总共是 10 的 80 次方。所以这种量级运算的话目前还是没有办法实现,AlphaGo 能战胜李世乭,是因为它采用了蒙特卡洛评估法和深度学习神经网络,这些高级算法的应用才能实现让机器去下围棋这个事情,完成本来我们人类才能完成的任务。
所以,人工智能的核心是算法——使用更高效和性能的算法就能完成更高级的任务。
人工智能算法的基础则是计算能力,这是第一个基础条件。就是如果说算的很慢,比如说机器要算下一盘棋,就算十步算一天的话,这种运算效率是完全没有办法进行围棋比赛的。第二个基础是数据,数据对于人工智能来说,就像经验对于人,如果机器对于围棋的数据没有办法处理和识别,就失去了这个基础。
人工智能的发展路径
人工智能发展依托 IT 信息产业的发展。首先是计算机,计算机出现,使得机器能够储存数据和计算。
第二是互联网,它的诞生使得机器能传递数据,另外,用户在互联网上的行为也能沉淀大量数据,这些数据都能交给机器处理。
第三是物联网,它让更多的传感器加入,能采集一些温度、环境信息。物联网介入之后,数据采集也能交给机器完成,提高了很多效率。以前的很多数据需要我们人工输入,有了物联网就能交给机器完成。
人工智能则是在数据应用突破环节,大家都谈了很多大数据,但是"大数据"大家不知道怎么用,这需要人工智能的算法和分析,实现应用的价值。
最后由人工智能算法实现了数据应用层面的突破。
总结起来,人工智能第一个发展阶段是在计算这个环节,它能够让机器像我们人类一样,开始能存会算,像一些神经网络和遗传算法出现,使得我们人类能够更高效、快速处理海量的数据,这也是后面发展的基础;二个阶段就是感知智能,就是让机器能听懂我们的语言、看懂世界万物。这时候的代表产品,比如说可以认出罪犯的摄像头,比如说你有一些异常举动,偷东西它就能发出警示,比如说有犯人的人脸数据就可以识别,犯人在什么地方出现都能被发现。还有听懂人类说话的等等。就是像这些感知智能的技术出现,可以帮我们人类更高效的完成听和看的任务。
第三个阶段就是认知智能,这时候就由机器去思考主动采取了一些行动,就比如在自动驾驶和一些能够独立完成任务的机器人。还有一些机器人做的医生决策助理这样的产品,这样的东西出来,机器人就可以开始更全面辅导甚至部分替代人的工作。比如说做手术,人工智能最大的价值就是来代替或者辅助我们人类来完成一些任务。因为它的运算效率非常高,同时可以快速复制,所以它能够极大地提升人工作效率,解放我们的劳动力。
可以预见,在人工智能发展之后,有一些重复性的劳动就很有可能就被机器替代,就比如说利用一些机器手臂完成一些流水线的生产,这些东西都是很典型的代表。所以从人工智能价值出发,至少目前来看,人工智能是 B2B 生意,比如说代替银行去完成一些身份验证。比如说刷卡,以后高铁,机场进站不要人来验票,这都是由机器来完成,降低机场和一些相关部门的成本。
人工智能的产业链的结构
最基础的一个部分就人工智能两个基础条件,一个是计算能力,一个是数据能力。所以说计算和数据这两个事情也是产业链的基础。再到第二层的话就是刚才讲到做核心算法的公司,他们做这种核心算法的研究,包括人工智能识别的算法等等,最上面一层的公司就是根据这技术去做一些应用,就比如说人脸识别的技术成熟之后,支付宝就拿人脸识别的技术去做身份验证,以后大家可以不要输密码,刷脸来做一个验证。
应用的话又分两类,有硬件产品的应用,就比如说机器人、无人机,和其他的智能硬件等等硬件产品的应用形式。还有一种是软件服务,就比如大家接触到虚拟个人助手,比如说度秘等等。
人工智能在当下的发展
人工智能这几年一个是依赖计算,就是摩尔定律,他到现在还没有失效。另外一个是互联网产生大数据,这在两个条件成熟后,2006 年,Hinton 等人提出了深度学习, 在数据训练上取得了巨大的突破。其实是对特征量的多次抽象的一种算法,在这算法提出之后,非常适合大数据的处理运算。再结合计算和数据,这三个条件基础成熟之后,使得人工智能的感知实现层面实现巨大的突破。大家可以看到现在语音识别和视觉识别的算法,它基本上识别率都达到了 95% 以上。在深度学习出现之前视觉和语音识别大概是在百分之六七十,我说十句话六句话都听懂,这是没有用。就是因为这种算法,数据和计算都成熟了之后,所以在感知层人工智能实现了一个突破。
那么认知从什么时候突破?其实我们现在还不清楚。因为单单深度学习神经网络能不能够让机器去思考这个事情,我们还比较有疑问。还有一个方向,是在做人脑的研究,就是想从脑科学实现认知层的突破,这个非常依赖生物和一些相关学科的突破,因为这方面现在也还在探究的过程中。什么时候解决这问题,不知道。所以说,人工智能在下一个阶段发展会在什么时候实现,我们还不得而知。
虽然我们不知道机器什么时候能思考,但是它现在已经能听会看,就是现阶段科大讯飞这些公司在感知层做了一些产品,已经实现了一些盈利,所以我们觉得基于目前的感知技术,去实现人工智能的一些方面是有很大的机会,而且这产业还是刚刚起步,不管是创业公司还是产业巨头都是有很大的机会。
感知智能的普及也还需要 5 到 10 年,因为它的技术还要提升,这个技术不只本身识别的技术还有一些应用化的技术,就比如说大家可能知道,去年有一个新闻,就是赵薇的老公,公证处是用人脸识别判断身份,有人用赵薇的老公的照片完成了识别工作,使他受到了损失,这些在识别的公司,在这事情发生之后,他们就研究了活体验证的技术,就不仅是认一个人,还能知道你这个人是活人,还是拿的照片,就是在这些基础上还要做一些技术应用化的改良,这改良需要一个时间。
还有一个刚刚提到物联网,就是数据这一块,物联网也还不够普及或者说发展还需要时间。在这方面的话,我们前几天部门分析师提了一个问题,说什么时候才能让机器去吃红烧肉,并且能知道这红烧肉好不好吃?现在的机器人比较少能处理这味道和嗅觉的数据,这就依赖物联网的传感器和其他相应的产业发展。
最后一个是计算,因为现在人工智能的计算量非常大,去年出来一个事情,就是说百度人工智能大赛的时候出现技术作弊的事情,虽然说那个事情导致对百度的名声不太好,但是这也震惊了业界,这个比赛规定说你再一个公司或者说一个团队在一周内只能上传一次数据,结果那百度上传了多次数据就判作弊,但是这事情的话,从另外一个方面说明了百度现在的计算能力特别强,就是别的公司是做不到,一周内要处理这么大量的数据,但是百度可以的,因此,计算也还是人工智能的一个瓶颈。所以,综合来看我们觉得人工智能发展到大规模的普及还是一个 5 到 10 年的时间,对大家来说还有很多的机会。
国内的人工智能发展
中国人在这方面做得还挺好,可能是因为中国人数学比较好,在人工智能方面做的比较好,尤其是语音和视觉识别里面,中国还是处于世界顶尖的顶尖的,像讯飞和百度也是突破了 95% 的语音识别门槛。FACE++和汤晓鸥教授团队,他们在各个国际比赛里面完全有能力媲美 Google、Facebook 等巨头企业,这是我们技术的情况。
不管是说像百度、阿里巴巴、腾讯这样的巨头企业,在人工智能都有大量的突破,百度是号称 2014 年投了 70 个亿,他们在这里面做了很多的事情,包括他们成立了无人驾驶事业部这样的事业部,推出了度秘。像阿里推出了大数据计算平台,昨天阿里推出阿里小 AI,还预测这一季《我是歌手》的冠、亚、季军。像腾讯的话,他们干的就是推出自动撰稿机器人,腾讯视觉识别平台、探索实验室以及华为的诺亚方舟实验室,都能看得出来,国内的公司都有大量的投入和布局。
再看创业公司,截止到 2015 年的数据,中国就是已经有一百多家创业公司,其中有 65 家获得融资,总融资金额在 29.11 亿人民币。大家也知道,艾瑞做了一个中国创业公司独角兽的榜单,这里面有四家公司都属于人工智能的领域。
人工智能投入了多少?在这四年的人工智能的投入都处于一个稳步上升,去年总共有 43 起人工智能领域的投融资时间,总共的金额是在 14.23 亿。今年企业融资大概有 4 个亿,本来 Q1 是属于投资行业的淡季,但是这 4 个亿可以看到中国人工智能能比之前的金额更高。
最后看一下细分领域分析,中国创业公司 70% 一直在做应用,这是我国的一些行业现状。我们在获得 Google、Facebook 的研究技术并且开源之后,我们很快把这技术应用落地,但是对于原创的研究底层和中层,我国的创业企业还是不太行。但是我们在在视觉和听觉方面做了很多的应用和很好的产品。
在应用的类型来看,大概是 83% 企业都是在做软件服务,硬件产品比如说机器人是比较少。
我们再来看看做算法,55% 在做计算机视觉,我们刚才已经提过了华人圈在做视觉识别,确实是很牛的。其他,有 13% 在做自然语言处理,9% 进行机器学习。