芯片帝国之架构篇 | 英伟达GPU独占风骚,英特尔掉队、谷歌奋力追赶

亿欧网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
芯片帝国之架构篇 | 英伟达GPU独占风骚,英特尔掉队、谷歌奋力追赶

CPU、GPU、 FPGA 、英特尔、英伟达、赛灵思……随着深度学习带来的AI的兴起, 芯片 领域最近可谓是风起云涌,一个个科技名词走进公众视野,成为网红。AI创企也在不断吸金,用芯片燃烧着一个又一个神话;与此同时,老牌芯片厂商,英伟达、赛灵思也在不断被挑战的同时,续写自己的辉煌。

芯片,作为高端制造业的“皇冠明珠”,在不断变小、改变架构的同时,不断凝缩着新的科技结晶,逐渐构建出更庞大、更精致的科技帝国。

亿欧推出“芯片帝国”系列分析稿件,从芯片的核心架构、应用场景、国内外主要玩家和下游晶圆代工厂等方面呈现芯片业的产业图景。当前AI芯片主要分为GPU、FPGA、 ASIC 及类脑芯片等。以下为第一篇架构篇,从通用芯片CPU及它的创始者英特尔说起,梳理AI浪潮下不同的芯片架构,及它们所构筑的科技帝国。

英特尔和CPU:开山鼻祖,集成通用芯片、PC界老大

芯片中,最令人熟悉的恐怕是中央处理器CPU了。作为一种超大规模的集成通用芯片,CPU可完成多种不同种类的任务,在PC世界里起着大脑的作用。而CPU的诞生也开始了PC时代的巨头——英特尔的辉煌历史。

英特尔是主要以研制CPU处理器的巨头,全球最大的个人计算机零件和CPU制造商 ,1971年,英特尔推出了全球第一个微处理器,它引发的微处理器所带来的计算机和互联网革命,可以说改变了整个世界。

但CPU虽统治了PC时代,随着 人工智能 兴起,传统的CPU算力不足这一问题便越来越突出,尤其基于CPU的传统计算架构无法满足人工智能并行计算的需求。AI所需的深度学习需要很高的内在并行度、大量浮点计算能力以及矩阵运算,因此在通用芯片之下,需发展适合人工智能架构的专属芯片。这也带来了英特尔地位的下降。

不过在更早时候,即移动互联网大潮袭来时,CPU巨头英特尔的劣势就已开始显现了。英特尔在移动端不敌来自生产ARM芯片(与英特尔X86平级的CPU架构,但采用精简指令集计算机,主打低成本、低功耗和高效率)的ARM公司,目前世界超过95%的智能手机和平板电脑都采用ARM架构。

再加上英伟达GPU在数据中心业务的竞争,2010年还占据整个半导体芯片市场80%多份额(据IHS的报告数据)的英特尔,到2016年第二季度,仅占14.7%。

为了在人工智能时代不落后其他科技公司,英特尔近年来通过收购一批在FPGA、ASIC等芯片领域的头部企业。在云端,2015年,英特尔收购全球第二大FPGA厂商Altera;在终端,2016年收购了研发高性能视觉处理芯片的Movidius;另外,英特尔2017年还收购了汽车领域的Mobileye,以此对抗英特尔在汽车领域的地位。

不过,今年7月,英特尔交出的财报显示,其Q2营收为169.62亿美元,净利润50.06亿美元,同比增长78%。虽然营收、净利润增速不错,但基于CPU、FPGA的数据业务并未达到之前的预期,英特尔股价还是跌了。

当然,英伟达虽然目前已有颓势,但CPU却也没有到马上要被替代的地步。

CPU虽然计算能力稍差,但它是通用计算机的处理核心,处理各式各样的指令要求,所有部件也都要通过它互联互通,其有着复杂的逻辑控制单元和独特的指令翻译结构,这是其他芯片目前难以替代的。

并且,ARM架构的CPU芯片在手机和智能音箱等领域也是不可或缺的。所以唱衰CPU,还是为时过早的。

英伟达和GPU:先发制人的“十项全能”选手,目前应用最广泛AI芯片

CPU的计算能力渐渐落后,也催生了崛起的图像处理器GPU及新的巨头英伟达。1999年,英伟达发明了GPU,这极大地推动了PC游戏市场的发展,重新定义了现代计算机图形技术,并彻底改变了并行计算。

相比CPU,GPU由于更适合执行复杂的数学和几何计算(尤其是并行运算) ,刚好与包含大量的并行运算的人工智能深度学习算法相匹配,因此在人工智能时代刚好被赋予了新的使命,成为AI硬件首选,在云端作为AI“训练”的主力芯片,在终端的安防、汽车等领域,GPU也率先落地,是目前应用范围最广、灵活度最高的AI硬件。

而英伟达也因此几乎成为AI浪潮中的最大受益者 ,在加速深度学习算法芯片市场几乎占垄断地位。英伟达2016年第一个推出专为深度学习优化的Pascal GPU,2017年推出了性能更优的新GPU架构Volta,及神经网络推理加速器TensorRT 3。目前占据全球GPU行业的市场份额超过70%,GPU作为其核心产品占据84%的收入份额。

另外,由于英伟达发布的针对开发者提供的并行计算平台CUDA,被广泛认可和普及,积累了良好的编程环境,目前应用在人工智能领域,可进行通用计算的GPU市场基本被英伟达垄断。

不过英伟达在PC端和数据中心业务上,也面临着老二AMD的挑战。

在PC处理器市场,AMD正在英特尔主导的市场“抢食”。从2017年3月至今年4月,AMD推出了锐龙7、锐龙5、锐龙3、锐龙Threadripper、锐龙2000等处理器。数据显示,在锐龙处理器推出后,AMD的桌面处理器市场份额已从8%增至12%;而英特尔的份额则下跌1.9%,至87.8%。

虽然,英特尔在数据中心处理器市场也占有绝对的领先地位,拥有99%的市场份额,不过野村证券称英特尔正在试图阻止将15-20%的数据中心处理器份额让给AMD。

目前GPU和英伟达,在人工智能浪潮下,可以说是风头正劲,不过在顶着“应用最广泛AI芯片”的光环,英伟达也还面临FPGA和ASIC等专用化程度更高、计算力更强的芯片的挑战。

赛灵思和FPGA:“变形金刚”,算法未定型前的阶段性最佳选择

同样能满足更高的计算需求,并可进行编程,1984年,赛灵思(Xilinx)发明了现场可编程门阵列FPGA,FPGA作为半定制化的ASIC(专用集成电路),顺应了计算机需求更专业的趋势,成为神经网络算法中的主流芯片。

FPGA可算是芯片界的“变形金刚”,在写入软件前它有胜于CPU的通用性,写入软件后它有类似于ASIC的表现,是算法未定型前的阶段性最佳选择 。FPGA相比GPU具有低功耗优势,同时相比ASIC具有开发周期快,更加灵活编程等特点。

在现阶段云端数据中心业务中,FPGA以其灵活性和可深度优化的特点,有望继GPU之后在该市场爆发;在目前的终端智能安防领域,也有厂商采用FPGA方案实现AI硬件加速。

FPGA市场的最大玩家是其创始者赛灵思 ,除了“通过系统集成和先进的‘软件定义’开发环境所扩展的新用户群体的服务”外,赛灵思在金融、制造业、娱乐、公共安全以及电信等传统行业,以及在自动驾驶汽车、无人机、智能监控等新兴行业都有布局。

在数据中心方面,全球七大超大规模云服务公司,已有3家采用了赛灵思FPGA,其中的百度于今年10月宣布,其已设计出赛灵思UltraScale™FPGA池。另外,赛灵思在车用电脑视觉处理市场占有率排名第二,仅次于Mobileye(2017年被英特尔收购),不过其与Mobileye间还存在着巨大差距。

赛灵思今年还收购了我国的人工智能创企深鉴科技,深鉴基于赛灵思的FPGA开发AI芯片,此前已和大华股份、东方网力等安防厂商展开合作,推出基于Xilinx FPGA的DPU产品。

除赛灵思以53%的份额(咨询公司Gartner2016年数据)占据FPGA市场头把交椅外,阿尔特拉(Altera)以36%的份额位居其后。 2015年6月,阿尔特拉被英特尔以167亿美元的价格收购后,英特尔在其基础上成立了可编程事业部。今年4月,英特尔的FGPA被正式应用于主流的数据中心OEM厂商中,主要客户包括戴尔、富士通等。

不过老大赛灵思在回复如何看待阿尔特拉被英特尔收购时,傲娇的表示:“我们依旧是第一,只是尾巴丢了”。

但由于FPGA要保证编程的灵活性,电路上会有大量冗余,因此成本上不能像ASIC做到最优,工作频率也不能太高。因而,在ASIC还并不成熟,同时GPU功耗和成本较高的现阶段发展较好。

谷歌和ASIC:“专精职业选手”,专一决定效率,AI芯片未来

随着专用化需求的进一步发展,芯片界又诞生了ASIC。ASIC(Application Specific Integrated Circuit)即专用集成电路,本文中特指专门为AI应用设计、专属架构的处理器芯片。

近年来涌现的类似TPU、NPU、VPU、BPU等,本质上都属于ASIC。 无论是从性能、面积、功耗等各方面,AISC都优于GPU和FPGA,长期来看,ASIC代表AI芯片的未来。

ASIC架构典型的代表,是谷歌的张量处理器TPU,其采用了脉动阵列的组织方式。2016年,谷歌TPU在AlphaGo与李世石一役中横空出世,使AlphaGo“思考”棋招和预判局势,处理速度比GPU和CPU快上几十倍。令人惊艳的的TPU,也一度被认为是AI芯片业内新的搅局者。不过TPU的资历也没比以上几位年轻,哈佛大学孔祥重教授在1970 s就提出了TPU的脉动阵列组织方式。

今年2月,谷歌也以Beta测试的形式开放了一直只是自用的TPU ,服务的名称为Cloud TPUs(云端TPUs),用于云端服务器。今年5月Google云端芯还发布了TPU 3.0,8月谷歌又推出一款为边缘计算定制的Edge TPU。

不过TPU目前并不对外发售,并且要想进入更多市场,它的通用性仍需检验。但谷歌TPU的推出,以及测试版对中小企业的开放,还是会对英伟达带来一定威胁。

而ASIC芯片领域,也有一大批追赶者。 以我国的初创企业而言,2017年9月,华为发售的AI芯片麒麟970上的NPU(属ASIC架构)集成了初创芯片企业寒武纪的1A处理器作为其核心人工智能处理单元。

2017年1月,地平线携手英特尔发布基于BPU(属ASIC架构)架构的最新高级辅助驾驶系统,12月,地平线机器人发布“旭日”和“征程”两款嵌入式AI芯片,面向智能驾驶和智能摄像头。

2016年,英特尔收购的视觉处理芯片企业Movidius,其研发的VPU也是ASIC芯片。

在AI算法尚处于蓬勃发展、快速迭代的今天,ASIC存在开发周期较长、需要底层硬件编程、灵活性较低等劣势,因此目前发展速度还不及GPU和FPGA。但长期来看,ASIC是AI芯片的未来。

IBM和类脑芯片:另辟蹊径,颠覆传统计算架构,仍在研发

另外,在传统架构之外,还有一类“不走寻常路”的芯片,这就是“类脑芯片”。“类脑芯片”颠覆传统计算架构,将数字处理器当作神经元,把内存作为突触,内存、CPU和通信部件完全集成在一起,采用模拟人脑神经元结构来提升计算能力。

“类脑芯片”以IBM TrueNorth芯片为代表,但由于技术和底层硬件的限制,其尚处于前期研发阶段 ,目前不具备大规模商业应用的可能性。从技术成熟度和商业可行性两个角度,使用AI专属硬件进行加速运算是今后五年及以上的市场主流。

我国初创企业西井科技也在研发类脑芯片,其宣称“芯片用电路模拟神经,成品有100亿规模的仿真神经元,可用于基因测序、模拟大脑放电等领域”。

不过,类脑芯片的商用并不乐观,西井目前也从研究类脑芯片转向自动驾驶领域。

总结:诸侯混战,同赛道纠缠,不同架构竞争

从CPU、GPU、FPGA,到ASIC及类脑芯片,从英特尔、英伟达、赛灵思、谷歌再到IBM,可以看出芯片业最近50年可谓风起云涌,而人工智能芯片的兴起只是最近的一次浪潮。

GPU、FPGA、ASIC及类脑芯片等可用于AI的芯片,也只是目前登场的芯片中的一小部分,其商用场景还未完全展开。而当前的AI芯片中,应用还是以GPU领先,FPGA可能成为下一个爆点,ASIC目前是被看好、但不成熟的新星。

再看芯片巨头的斗争,英特尔与ARM在CPU市场、英伟达和AMD在GPU市场、赛灵思和阿尔特拉在FPGA市场上,及谷歌和一些创企在ASIC市场的竞争……而在AI浪潮下引导的芯片革新上,英特尔与英伟达,赛灵思以及谷歌又在不同芯片架构及应用场景间进行斗争。

可以说这确实是一场“诸侯混战”,而身处变革中的每一个巨头,都不想在战争中先倒下。


近年来,粤港澳大湾区在打造创新驱动新引擎,科技创新带动资源集聚等方面着力颇多,创新机制、产业升级、人才引流、协同发展等带来了多方面的机遇。相应的,人工智能、人才赋能正深刻地影响着商业步伐。

2018年10月18-19日,亿欧将在深圳举办 “引擎·引领” 2018大湾区国际科创峰会(BATi) ,集合智能制造、智能产品、智慧城市、智慧安防、智慧交通等一众热点问题展开探讨,分析科技创新未来趋势,盘点技术革命下的发展契机。

报名链接:

https://www.iyiou.com/post/ad/id/664?herkunft=6648

芯片帝国之架构篇 | 英伟达GPU独占风骚,英特尔掉队、谷歌奋力追赶

版权声明

凡来源为亿欧网的内容,其版权均属北京亿欧网盟科技有限公司所有。文章内容系作者个人观点,不代表亿欧对观点赞同或支持。

随意打赏

提交建议
微信扫一扫,分享给好友吧。