硅谷四大人工智能巨头比拼,你看好谁?
【编者按】 人工智能 已经在全球刮起一次前所未有的技术浪潮,回归到行技术和产业本身来看,硅谷在这一领域的布局是非常超前和根深蒂固的。其中, IBM 、 谷歌 、 英伟达 和 英特尔 四大巨头扎根最深,来看下他们在人工智能领域到底有哪些布局。
本文转载自智东西,亿欧编辑,供行业内人士参考。
IBM:入局早,深刻受益行业发展红利
人工智能是IBM在2014年后的重点关注领域。IBM在AI领域无出其右,如80年代的专家系统、1997年击败国际象棋冠军卡斯帕罗夫的深蓝计算机、2011年在美国智力竞赛节目《危险边缘》中战胜其人类对手的沃森系统均出自IBM。IBM在AI领域布局围绕沃森和类脑芯片展开,试图打造AI生态系统。目前IBM已撤销全球业务咨询GBS和技术服务GTS等部门,并转型成认知解决方案和云平台公司。
IBM未来十年战略核心是“智慧地球”计划,IBM每年在其投入研发投资约在30亿美元以上。未来IBM的创新解决方案在智慧能源、智慧交通、智慧医疗、智慧零售、智慧能源和智慧水资源等领域全面开花,涵盖节能减排、食品安全、环保、交通、医疗、现代服务业、软件及服务、 云计算 、虚拟化等热点方向。
2016年Q3,以沃森为代表的认知解决服务实现营收128.89亿美元,营收增长迅速,占比高达22.17%,IBM在AI领域盈利开始爆发。我们预计2016-2018年IBM认知解决服务分别实现营业收入190.39亿元、218.95亿元、240.84亿元,届时认知解决服务占IBM营收比例将达24.56%、26.89%、28.72%,成为驱动IBM业绩增长的主要业务。
沃森引领认知商业:
目前,IBM不再将沃森作为单一系统开展业务,而将其功能分割成不同组成部分,每个部分都可被租用出去以解决特定商业问题。以IBM沃森为代表的认知技术将商业带入认知商业时代,帮助各行业挖掘商业价值,重塑产业格局。IBM在替客户提供创新解决方案,客户不断向沃森输入自己企业数据并对沃森进行训练。
认知商业时代中,以认知计算、 大数据 分析、物联网、异构计算、神经元芯片Synapse、认知型机器系统等为代表的一批新兴前沿技术应用逐步走进新能源利用、污染防治、城市管理、生态改善、医疗、交通、食品安全追溯及社区服务等领域。
沃森在分析问题并确定最佳解答时,运用了先进自然语言处理、信息检索、知识表达、推理和机器学习技术,来收集大量证据、生成假设、并进行分析和估。目前,沃森已开发40种不同产品,包括常见语言识别服务等。沃森善于认知,专为理解、推理和学习而设计,有机会战胜从前无法完成挑战,如智胜医疗挑战、智胜水资源管理挑战、智胜保险诈骗挑战、智胜时尚挑战、智胜环境挑战、智胜并购风险挑战等。
沃森+医疗构建智慧保健平台:
沃森在医疗领域主要关注肿瘤和癌症的诊断,其优势在于自然语言处理,通过挖掘非结构化数据寻找深层关系。沃森医疗商业战略为:
1、深度聚焦肿瘤领域,并向其他领域扩展;
2、通过大规模收购获取数据资源;
3、通过合作等扩展使用场景,输出生态能力。
汇聚了医疗保健数据、人力、能力、客户后,Watson Health将成为潜力巨大的医疗保健大平台,沃森认知计算助力智慧医疗领域。沃森效率、精确度大幅高于人类,“认知计算+医疗”前景广阔,IBM深刻受益行业发展红利。
强力研发类脑芯片:
此外,IBM还凭借其强大的认知计算能力,应用于数字顾问、虚拟助理、云计算、科学研究等多领域,大力研发量子计算电路,开放量子计算平台,推出多款并行式类脑芯片,提升AI算力。2015年11月,IBM开源了人工智能基础平台SystemML,可支持描述性分析、分类、聚类、回归、矩阵分解及生存分析等算法,沃森整合了诸多SystemML功能。
谷歌:软硬件结合,开源系统构建AI生态
谷歌大数据检索核心技术领先于全世界,并建立了全球最大的数据库系统。广告盈利是谷歌的主要盈利模式,目前九成以上营收来自其广告系统。2015年8月,谷歌宣布架构重组,设立母公司Alphabet,谷歌由搜索引擎公司全面转向为覆盖诸多领域的高科技企业。
谷歌在2011年成立AI部门,目前已经有100多个团队用上了机器学习技术, 包括谷歌搜索、Google Now、Gmail等,并往其开源Android手机系统中注入大量机器学习功能(如卷积神经网络开发Android手机语音识别系统)。谷歌目前产品和服务依靠主要AI技术驱动,如谷歌使用深度学习技术改善搜索引擎、识别Android手机指令、鉴别其Google+社交网络的图像。
谷歌AI途径为:
1、覆盖更多用户使用场景,从互联网、移动互联网等传统业务延伸到智能家居、自动驾驶、 机器人 等领域,积累更多数据信息;
2、积累底层人工智能技术,研发更高级的深度学习算法,增强图形识别和语音识别能力,对信息进行更深层加工、处理。谷歌试图将AI渗透到了旗下各产品,为用户带来更多使用场景、及更智能化功能。
研发+并购坐拥两套AI系统:
2015年11月谷歌开源第二代深度学习系统Tensorflow 。Tensorflow可编写并编译执行机器学习算法代码,并将机器学习算法变成符号表达的各类图表,缩短重新写代码时间。TensorFlow可模仿人类大脑工作的方式并识别出模式,被用于语音识别或照片识别等多领域。另外,使TensorFlow编写的运算几乎不用更改就能在多种异质系统上运行。在开放源代码后,所有工程师都将帮助谷歌修改和完善这项技术,谷歌收到反馈以后,可推出更好地服务和产品,进而推动整个AI产业发展。
DeepMind创立于2010年,其将机器学习和系统神经科学最先进技术结合,建立强大通用机器学习算法。 2014年1月,谷歌耗资2.63亿美元收购Deepmind,同年12月,谷歌通过DeepMind与牛津大学的两支AI研究队伍建立了合作关系。2015年2月,Deepmind系统学会了49款雅达利经典游戏。2016年3月,由Deepmind研发AlphaGo以4:1嘉绩击败世界围棋冠军李世石,激发全世界对人工智能的关注。当前AlphaGo专注于棋赛发展,但其未来还将应用于医疗诊断,或投入 无人驾驶 等领域,以加速AI商业化进程。
虚拟助理融合智能家居,推进生态建设:
谷歌认为智能家居领域将是未来AI应用的一个重要市场,目前世界各国的智能家居渗透率均较低,为此Google正加速以Nest、Google Assistant为基础智能家居生态系统建设,通过一系列并购、开放平台的建立、软件硬件一体化来打造这个生态系统。
谷歌2016年5月,推出语音智能助手Google Assistant,是语音识别、人工智能、自然语音理解的集大成者。Google Assistant能完整地理解上下文语境并回答问题,将和Alexa,Siri和Hound等智能助手竞争。相比Google Now主要用于手机和PC上,Google Assistant则开始融入各种设备(Google Home、Allo聊天机器人)。根据MarketsandMarkets预测,自然语言处理市场规模将从2016年76.3亿美元增长至2021年的160.7亿美元,年增速达16.1%。
2014年6月,谷歌通过Nest耗资5.55亿美元收购了基于云端的家庭监控公司Dropcam,10月又收购了智能家居中枢控制设备公司Revolv,Revolv将参与Nest “Works with Nest”开放计划。2016年5月推出Google Home(智能音箱)。Google Home是一个基于Google Assistant语音控制的智能音箱。相比亚马逊Echo而言,Google Home将利用谷歌庞大数据库去理解用户需求。
传感器结合AI算法研发无人驾驶原型车:
谷歌无人驾驶汽车项目始于2009年,2011年为其收购510Systems、Anthony’sRobots等公司。目前无人驾驶行驶里程达180万英里,且成功发布了全球第一款完全能够自动驾驶的原型车“豆荚车”,并宣称到2020年谷歌自动车将正式上市。
谷歌无人驾驶以技术驱动,侧重于基础技术研究及AI核心科技开发。在攻克相关深度学习及大脑技术开发等软件算法基础上,集成各种传感器。2015年12月,谷歌和福特将成立一家合资公司,基于谷歌AI技术研发无人驾驶汽车,可节省造车技术的时间和资金。
联手NASA研发量子硬件,发布TPU进军芯片市场:
谷歌已建立量子人工智能实验室(QuAIL),该实验室由美国宇航局(NASA)、大学空间研究协会共同承办。2013年,谷歌已利用D-Wave机器在Web搜索、语音/图像模式识别、规划和行程安排、空中交通管理、机器人外太空任务等应用中进行量子计算的探索,并支持任务控制中心的操作。2014年,谷歌利用其在D-Wave机器上经验来开发量子硬件,通过聘任加州大学物理学教John Martinis及其团队,来建立谷歌的专属量子芯片。
2016年5月,谷歌发布为机器学习特别研发的TPU(张量处理单元)芯片。 TPU芯片在计算精度降低时更耐用,用更多精密且大功率机器学习模型。通过快速应用这些模型,用户得到更正确结果。Google宣称,TPU将机器学习能力提高三代,TPU将摩尔规律向前推进7年。在“深度学习”领域,TPU也比“GPU”和“FPGA”单位耗电量性能提升10倍。
NVIDIA:GPU大势中,布局端到端AI平台
基于传统PC GPU业务渐于饱和、及对AI潜在市场强烈看好,NVIDIA正积极谋求战略转型。2015年Q1已不再提及传统PC GPU业务,并将战略重点投向游戏、专业工作站、数据中心和汽车电子等四大市场,NVIDIA GPU 芯片目前在虚拟现实、人工智能和无人驾驶汽车等领域位于重要中心。2016年Q2,NVIDIA实现营收高达14.3亿美元,同比上年增长24%,同比2016年Q1增长9%,这主要是受游戏、数据中心及专业虚拟化、Tegra无人驾驶系等产品强劲需求驱动。AI芯片市场需求旺盛,呈现爆发增长态势。
与CPU相比,GPU具有数以千计的计算核心,及强大、高效并行计算能力,可实现10-100倍应用吞吐量,特别适用于AI海量训练数据情形。 目前深度学习解决方案几乎完全依赖NVIDIA GPU。根据艾瑞咨询,2020年全球AI市场规模达1190亿元,市场潜力巨大。据机构预测,硬件市场占AI市场份额将达30%。此外,NVIDIA还专门设计了全球首款针对深度学习的GPU架构(Pascal架构)。
AI领域,NVIDIA不想做单纯的硬件或者软件厂商,致力于打造于基于AI平台化公司,构建端到端的深度学习平台。NVIDIA CEO黄仁勋表示,未来NVIDIA将是基于人工智能平台化的公司,业务将涵盖智慧城市、交通、超级运算等领域。
NVIDIA在AI和自动驾驶领域,形成了以Tesla P100和DGX-1为核心的训练体系,以P4/P40和Tensor-RT为核心的数据中心推理体系,及以Jetson TX1与Jetpack2.3、DRIVEPX2与Driveworks为核心的智能设备体系。NVIDIA在上述领域从硬软件到解决方案上都进行了全面布局,构建了端到端的深度学习平台。
英特尔:研发+收购抢夺芯片市场份额
近年来,英特尔传统业务表现不佳,为避免对PC、服务器的过度依赖,公司基于主业积极谋求战略转型,将业务从PC芯片、移动芯片拓展至数据中心(云服务)、物联网、人工智能等领域,还提出“2016重建计划”,将未来工作重心从PC芯片转向物联网和云计算。随着战略转型推进,预计未来三年英特尔数据中心、物联网营收增速将维持在5%-10%之间。
根据CB Insights,英特尔在AI领域总投资额排在第二位,这将加强AI核心竞争力。 未来英特尔将打通从云端数据中心到设备终端,历经大数据处理环节,再回到云端数据中心等AI闭环,打造AI生态系统以谋求领导地位。英特尔AI终端布局聚焦于人机交互,通过提供英特尔Curi模块、Edison计算平台、Cedar Trail芯片平台、RealSense实感技术及凌动处理器等技术,进一步提升终端设备智能化水平,并将设备数据上传至后端数据中心。AI后端布局主要是研发适合机器学习CPU芯片(如Xeon Phi)、及FPGA芯片,以拓展AI计算性能。
软件上,致力于数学核心函数库和数据分析加速库:
目前,英特尔已开源针对深度学习数学核心函数库——深度学习神经网络(Intel MKL-DNN),以供MKL深度学习神经网络层的使用。2015年发布数据分析加速库DAAL,可帮助第三方开发者在Intel底层硬件上更好进行机器学习模型的搭建和训练。Intel在2017年还将在“数学核心函数库”产品中发布神经网络API,供开发者直接调取,降低了开发者入门机器学习的门槛。
此外英特尔还围绕AI领域进行了一系列收购(如体感识别公司Omek Interactive、Hadoop咨询公司Xtremeinsights、自然语言处理初创企业Indisys、联想记忆Saffron Technology、半导体厂商Altera、半导体功能性安全方案厂商Yogitech、计算机视觉公司Itseez、AI初创公司Nervana、计算机视觉公司Movidius)。
硬件上,三管齐下对抗NVIDIA GPU:
英特尔芯片虽以高速处理数字著称,但NVIDIA GPU芯片在处理视频、语音等非结构化数据及识别模型时更为高效,在深度学习、神经网络服务器等性能表现远超英特尔。
2016年4月,英特尔发布极适宜处理机器学习模型评分(scoring)应用的双路服务器芯片Xeon E5-2600v。目前英特尔正为AI应用研发至强融核处理器家族Xeon Phi,计划2017年推出至强Xeon Phi新型芯片(代号为 Knights Mill)。
借助英特尔底层芯片架构,京东、奇虎360将机器学习模块可扩展性提高10倍,部分机器学习周期缩短8倍。未来百度Deep Speech平台数据中心将使用这款Xeon Phi芯片,以最大限度地提高自然语言的语音的解析速度。预期未来至强Phi将广泛应用于语音识别、图像识别、及自动驾驶等领域。
同时,2016年8月,英特尔耗资4亿美元收购深度学习初创企业Nervana,通过Nervana Systems在硅层实现机器学习,而非基于GPU架构。Nervana针对神经网络设计了Engine芯片,在深度学习训练时,Engine芯片比传统GPU的能耗和性能优势更为突出(据称Nervana处理器速度可达到GPU的10倍)。收购Nervana,Intel可将CPU优势延伸至深度学习领域,缩短开发深度学习应用、及应用推广时间。
此外,2015年12月,英特尔以167亿美元收购了FPGA厂商Altera。目前英特尔正开发统一的接口,试图将Altera的FPGAs和英特尔至强系列处理器封装到一颗芯片,新芯片将以互补、配合方式完成深度学习训练。2016年4月,英特尔与科大讯飞联手推出的深度学习计算平台,借助英特尔至强处理器及Altera FPGA的底层硬件技术,依托科大讯飞在自然语言处理、语音识别方面的核心技术,可实时将发言者的语音转化成文字,准确率高达95%。未来至强、FPGAs一体化芯片将大幅提高CNN影像识别、目标探测、发现大数据规律的效率。
在无人驾驶、机器视觉领域频频发力:
英特尔在车联网领域频频发力,着力研发“ADAS高级驾驶助手系统”,并与众多汽车厂商进行合作测试。在中国与中交兴路组建“车联网联合创新中心”,共同探讨智能车载终端技术、车联网云平台、行业大数据解决方案及业务模式创新。
英特尔还在机器视觉领域进行系列重磅收购,以加速无人驾驶项目推进。2016年5月,英特尔收购计算机视觉(CV)算法公司Itseez,Itseez助力英特尔研发创新型深度学习的CV应用(如数字安全监控、自动驾驶、工业检测),以打造从汽车到安全系统的物联网(IoT)。2016年9月,英特尔收购计算机视觉开发商Movidius。Movidius技术被用于Google、大疆、联想等公司,为无人驾驶飞机、安全摄像头、AR/VR耳机等智能设备提供视觉功能。收购后,Movidius将与英特尔的RealSense技术配合。
结语
笔者认为,随着谷歌、IBM等巨头相继开源AI平台,NVIDIA、英特尔公司深攻AI芯片,AI商用化的技术壁垒大幅降低,AI将迎来商用化高潮。智能家居、无人驾驶、模糊检索等领域将率先发展。
目前来看,IBM、谷歌在基础层、技术层、应用层全面布局。IBM已经转型成认知解决方案和云平台公司,沃森将开启认知商业时代。谷歌则聚焦机器学习,并充分发挥平台优势,构建软硬件结合生态。NVIDIA和英特尔作为传统芯片公司,面临着PC、移动智能终端等市场逐渐饱和的压力,以及AI市场强劲的市场前景,致力于研发可行的AI硬件,并在AI框架和商业化应用有着诸多尝试。