沈强:人工智能时代,技术创新将全面引爆商业变革
编者按:本文来自微信公众号“将门创业”(ID:thejiangmen),36氪经授权发布。
早在1956年,人工智能就在美国达特茅斯大学召开的学术会议上被提出,然而,经过整整一个甲子的起伏反复,却始终没能形成产业发展。进入2016年,借着AlphaGo与李世石的人机世纪对战,人工智能再次掀起一波小高潮。
正如将门CTO/将门创投创始合伙人沈强日前在接受ZD至顶网记者采访时所说,引爆一个技术一方面要求技术确实要达到一定的水平,另一方面也要有一些标志性的事件推波助澜,要有很好的技术PR效应。
显然,AlphaGo为人工智能的“回归”做好了十足的舆论基础,创造了契机,加上巨额资金的投入、在技术的更替发展,以及众多国内外巨头纷纷的加速布局,AI产业也将逐步开始形成。
以下为访谈实录:
引爆技术概念前提:技术水平的提升+技术PR效应
现在,我们所谈的人工智能是一个十分广泛的概念。从不同的技术层次来看,分为领域应用技术和数据智能基础技术。其中,人工智能中的领域应用技术包括计算机视觉、语音识别、自然语言理解等针对特定领域的信息类型和针对该类信息进行处理的技术,计算机视觉从模式识别研究手段转化到现在数据驱动手段,而语音识别过去也都是基于语法结构的,这些相关的技术在过去很多年里都在各个领域有了很多发展,因此各自已经形成了比较成熟的方法和方向。在这些应用领域技术下面,还有一层更加基础的数据智能技术,包括机器学习、深度学习、搜索与优化等适用于更广泛问题的建模、与应用领域无关的技术。通常我们在谈人工智能的时候,很容易把这些概念都混淆在一起。
而事实上,早在十几年前,当人工智能还没有今天这么流行的时候,那些基于数据、基于统计的研究方法就已经是人工智能技术的一部分了,只是还没有成为行业发展的热词。
现在,我们经常并列地提机器学习和深度学习,但其实机器学习有很多不同的方法,深度学习只是机器学习的一个子集,如今它已经在各个领域的应用有很多非常成功的案例。这些蛰伏已久的技术,往往会通过一些行业龙头公司的标志性的事件成为广泛认知与应用的引爆点。
比如说Google通过深度学习神经网络实现了猫脸识别,正是借着Google本身的光环效应才使得这个事件引起了广泛关注,如果换成其它普通公司可能就不见得能达到这样的效果。而AlphaGo战胜李世石的事件更是充满了许多抓人眼球的新闻点:明星技术公司、世界顶尖棋手、人机大战之于人工智能发展进程的象征性意义,无不吸引行业以及大众的注意力。引爆一个技术一方面要求技术确实要达到一定的水平,另一方面也要有一些标志性的事件,要有很好的技术PR效应。
因此,近两年来,随着Google、IBM、微软等公司在人工智能领域的长期投入开始展露出商业成果,并进行广泛的市场宣传,不仅逐渐点燃了工业界的热情,加强了研究者的信心,同时也有很多产业、资本开始投入到其中,使得人工智能开始赢得了大众的关注。这让我们突然就感觉到了人工智能时代的到来。
AI产业爆发三大条件:算法、算力、数据
进一步来说,AI从概念到产业的爆发还需要具备三个条件,即算法、算力、数据。
算法方面,随着深度学习理论和工程技术体系的成熟,包括通过云服务或者开源的方式向行业输出技术,先进的算法被封装为易于使用的产品和服务,越来越多的人和公司能够开始使用这些算法。人工智能相关的技术包括了水平层和垂直层的技术,水平层面上主要体现在算法方面。这两个层面都有很多大厂商都在做,包括Google、微软、Amazon以及一些开源的第三方软件,都试图在搭建通用的人工智能机器学习和深度学习计算底层平台。而上面的应用比如说语音、文字、图像、即时定位等等,也有很多开源的框架,特别是图像处理,很多框架都应用了机器学习和深度学习。从这方面来看,我认为人工智能的产业化已经开始了,各个层面的企业都将参与其中。
例如微软,九月份刚刚进行了重组,成立了人工智能及微软研究事业部,总共有5000多位科学家和工程师,这是一个巨大的投入。再比如IBM,今年初提出转型到认知计算(Cognitive Computing)和云平台,高调进入人工智能领域。除此之外,在国内,百度、科大讯飞等公司也在人工智能上投入了大量的资源。
所以从趋势上来讲,人工智能时代的到来是明确的。
算力方面,云计算的兴起起到了非常关键的作用。因为深度学习是极其消耗计算资源的,而通过云计算就可以以低成本获取大规模的算力,你要动态地获取几千个CPU,甚至上万个CPU的算力都不是事儿。除了云计算之外,GPU计算的进步对深度学习也有很大的推动作用,它能够加速深度学习中的计算速度,有些情况下甚至成百上千倍的提高。例如,现在深度学习的算法涉及到了大量可以并行化的矩阵运算,而GPU的工作方式就是多核并行计算流的方式,这个特点特别适合于人工智能领域中的计算。此外,一些面向人工智能的专用硬件架构也开始出现,比如说用FPGA去做专用的人工智能加速芯片和加速的基础设施,微软的数据中心就大量的运用了FPGA技术。
在算力相关的技术领域中,NVIDIA是比较早意识到了人工智能潜力的公司。早在2012年,NVIDIA就开始在人工智能上投入大量资源,到现在的成绩还是挺不错的,不管是在服务器端的运算发布DGX-1大幅加快训练速度,或者基于Pascal架构的Tesla P100支持数据中心加速,还是为支持嵌入式产品而推出的Jetson TX1,都获得了市场的高度关注。总体来看,他的产品线体系已经比较完备了,并且NVDIA并不只是提供一个空的计算架构,他也给软件开发人员做了很多开发的库,包括为汽车的自动驾驶领域提供从模组到软件一整套齐全的解决方案。NVIDIA在人工智能的战略上是很清晰的,可以说抢了一个先机,有很多实质性的商业落地。比如已经有多家公司将NVIDIA技术嵌入到摄像头中进行智能视频数据分析。
此外,Intel和NVIDIA一样都是做芯片的,虽然英特尔意识到这个事情会稍微滞后一点点,但是他的补救动作也还是很及时的,今年Intel收购了包括Itseez,Nervana System, Movidius等在内的很多人工智能技术公司,加上Altera和去年收购的Saffron Technology等,快速形成了在计算机视觉技术、数据中心里人工智能计算加速、FPGA芯片等方面的布局。所以尽管它的发力晚了一点,但也展示出了坚强的决心和强大的实力。相信Intel会做很多扎实的事情,推进面向人工智能的CPU、GPU、FPGA的融合计算架构,一定是它未来的发展方向。
总体来看,他们两家是各有优势的,如果从收入规模来看,NVIDIA比英特尔小得多,正是因为他的体量小,所以在人工智能领域的收入比例就会显得大很多,这是他引起媒体持续关注的一大原因。
除了这两家之外,还有高通也是一个很有潜力的参与者。他的强项是移动芯片,但移动芯片的低功耗要求使得运算性能很难做得特别高。数据训练显然就不是高通的强项,因为数据训练是性能驱动的,英特尔、AMD、NVIDIA这些公司在服务器端比较擅长。但是高通可以专注在设备端所需的推理计算,在移动端功耗很低、算力不是那么强的情况下,人工智能也有一些能力上的需求。这些能力的实现分两种途径,一种是加强通用计算的能力,比如CPU里计算单元应该做一些什么样的改进才能适合于人工智能的工作量。另一种是专用的,比如针对视觉、语音等等这些领域的问题,开发专用硬件提供给设备端,现在很多公司的方向都是把专用领域里的一些能力放到端上去。
再比如人工智能应用的一些领域——AR、VR,MR,这些领域有很强的智能技术能力需求:例如对外界环境的智能感知能力,除了基本的几何识别能力,其实还有很多语意理解能力的要求。而AR/VR/MR所需要的人工智能很多也是要在端上实现的,不能完全依赖于云。所以我们可以看到,未来会有很多的类似于高通的厂商会加入到设备端智能能力的提供上来。人工智能在设备端的需求量是相当巨大的,在三年以内,我们就能够看到有大量设备端人工智能产品出来。
当然,关于算力虽然我们谈了很多硬件基础设施对人工智能发展的支撑,但是影响人工智能算力需求最重要的还是软件和算法,因为算法决定了计算的复杂度也就决定了算力资源的需求。另一方面,无论是CPU、GPU还是FPGA的计算架构,规模最庞大的算力最主要的提供方式将是通过云服务的方式向广泛的公众用户提供出来,加速人工智能民主化的过程。Google、微软、Facebook、Amazon等行业龙头,都在大力开发人工智能的云服务,积累大量的算力资源,期望成为智能时代的计算平台霸主。
数据方面,近年来由于移动互联网的爆发使得我们积累了大量的数据,同时物联网也极大的扩展了获取数据的数量和类型。事实上,相比较于算法和算力,数据的获取会更难一点。因为它是建立在已有业务基础上的,以往我们都是先通过非人工智能的方式积累大量的数据,而现在初创企业要去获得它就需要一些巧劲。每个时代都要解决不同的问题,今天人工智能公司也一样需要去解决问题,就怕打着人工智能的旗号,做一些不接地气的事,不能够为用户解决实质性问题。
谈到数据,我认为这是国外厂商要实现人工智能技术在中国的落地需要解决一个重要问题。在数据管控方面,我们国家对数据主权的保护越来越重视,这对国内的企业来讲是一个利好。但是,长期来讲,数据的流动是难以避免的。对此,国内企业要及时抓住时间的窗口,不断快速地建立起竞争壁垒。
我认为,只有当以上三方面都做好准备的时候,人工智能时代才能真正地到来。而现在恰恰是三个要素刚刚开始具备的起点。
人工智能的发展路径一定是以创造价值为导向,而不是以技术先进为导向的。对不同的业务来说,有的情况下人工智能是优化业务的支撑手段,而有情况下则是创造差异化竞争优势的初始核心能力,团队在创业时候一定要辨明其业务属性到底是什么,以及人工智能在企业发展阶段中的不同作用。
未来,人工智能将如空气和水一样渗入到各行各业
我们特别看好人工智能在各行各业的应用,未来它会像空气和水一样会渗透到我们的日常生活中,会像移动互联网一样渗透到各行各业里面去,并重塑未来的数字商业格局。举几个行业的例子:
在交通领域,智能驾驶是人工智能技术施展能力的大舞台。人工智能解决的很多是人的一些下意识就能处理的问题,比如分清哪里是道路哪里是行人,地上的东西是个塑料袋还是个盒子等等。人有多少这样的能力,就有多少待解决的问题。再比如长途汽车司机的疲劳驾驶,这是货运驾驶里最大的安全隐患,常常造成很多的交通事故。而通过将智能驾驶功能应用用在卡车、汽车中,实现紧急情况由人来处理,简单的操作由系统自动处理,有一些进行半自动处理,这样就可以大大地缓解疲劳驾驶,提升行驶安全。智能驾驶是一个巨大的市场,能够很好反哺这个领域内的智能技术研究,形成健康的循环,是发展人工智能技术的优质土壤。
再来看金融领域,这个行业有很多的数据积累,人工智能可以在其中实现智能的资产管理、智能投顾、做更加合理的金融决策等等。人工智能从技术上解决的很多都是非确定性的问题,它能够做各种概率的判断,并且从不确定性中去获得收益或者做出更好的决策,而金融业务本身就是关于风险管理的业务。此外,还包括金融欺诈的问题,反欺诈、反洗钱,如何从各种各样的蛛丝马迹中推断交易的可靠性,判断资金的流向以及发生的周期性规律等等,都是人工智能将要去解决的问题。如今,金融系统是在一个广泛互联的世界里看问题,金融机构能够获取的数据是动态的,包括你在淘宝、电信局、个人的组织机构等地方的行为信用,这些数据比原来大很多,而AI在这里就可以起到很大的作用。
在医疗领域,从技术特征来看,这里同样充满了大量的非结构化数据,包括医疗影像数据、医生医疗记录的草书、医患之间对话等等。举一个医疗影像识别的例子,以往对于医疗影像的解读基本上都是依赖于医生本身的专业知识,没有办法用规则写出来。但是人工智能的应用,就能够做精确的几何层面的解读,也能够去做大量的数据训练,从而判断图像特征反映的问题,为医生提供有效的辅助。再举一个语音记录的例子,现在优质医生资源紧缺,对于患者病情的记录都特别精简,而且都是难以识别的手写天书,但是未来这些信息是要求尽可能电子化的,只有这样才能进行数据积累和分析。利用语音病例录入技术,就能解决这方面的问题。
人工智能还处在产业发展早期阶段,却是确定不移的方向
人工智能领域的公司大致可以分为平台技术公司和业务应用公司,应用型的公司能够解决真正的商业问题,而且有很多高价值的数据是跟领域技术有紧密结合的。拥有人工智能技术很重要,但不是创造价值的全部,光有人工智能技术是不足以解决业务问题的。比如自动驾驶领域,这个领域综合性很高,涉及到传感层面、感知、认知、决策、行动,此外,汽车遇到行人就要刹车、打方向盘,这是底盘控制的一套系统,其中有很多是依赖于机电机构的,但是也非常关键。此外,人工智能除了场景要落地,它在垂直领域里所拥有的其他能力综合也十分重要的。比如说获取数据的商业关系,在金融行业做智能投顾,首先要拿到很多相关的数据,这是一个长期的过程。所以进行人工智能创业,虽然有很强的技术特性,但是还需要很多因素的配合。
建立人工智能技术平台业务的难度更高,虽然充满着挑战,但一定要有人在前面开路。当初移动互联网刚兴起的时候也是这样,首先是移动技术平台,通过移动应用开发各种各样的工具,包括移动商店、分发等等,这才促进了移动应用的大爆发。AI其实也是这样的,有很多大厂商已经开始建立技术平台了,但总体来讲是还处于产业发展的早期阶段。
现在人工智能更多地还处在市场教育过程中,任何一个新技术的进入刚开始都是由先导性的企业发起,再慢慢进行市场教育。移动互联网市场也教育了至少有五年的时间,其实AI现在也是一样,虽然已经引起很多人关注,但是渗透到各行各业还要挺长的时间,但这是确定不移的方向。
将门是一家专注于加速和投资技术驱动型创业公司的创投机构,在创业服务方面,将门专注于为技术驱动型的创业公司对接标杆用户、连接产业资源并提供众多战略投资机会;在投资基金方面,将门专注于投资通过技术创新激活商业场景,实现商业价值的初创企业。关注领域包括机器智能、物联网、自然人机交互、企业计算。