互联网公司下场造芯背后,产业数字化的深度布局
近日,腾讯招聘官网出现了多个与芯片有关的岗位,引发外界关注。
腾讯招聘披露的芯片研发岗位包括:芯片架构师、芯片验证工程师、芯片设计工程师等多个职位,工作地点可选择北京、上海、深圳等。
以芯片架构师为例,职责包括:负责AI芯片和通用处理器或者细分领域的需求分析,主导AI,处理器芯片架构设计,竞争分析和规格定义;负责芯片领域的技术演进路标、关键技术,主导关键技术和架构的研究;负责大型芯片的架构设计,关键模块的把控和设计等。
而芯片设计工程师则要求精通数字电路设计流程,精通RTL代码书写,具有电路优化的经验;4年以上数字前端设计经验,有大规模 SoC 芯片设计成功量产经历以及CPU/NPU 等设计经验者优先等。
该招聘消息一经爆出,业界开始纷纷猜测:腾讯真的要进军“卡脖子”芯片领域?
对此疑问,7月16日腾讯相关人士回应称, 这是基于一些业务需要腾讯在特定领域有一些芯片研发的尝试,主要是AI加速和视频编解码等,但这并非外界所认为的通用芯片。
互联网大厂齐聚“造芯”赛道
实际上,腾讯几年前就已经开始了芯片领域的布局。
2016年11月,腾讯就与阿里一起领投了可编程芯片公司Barefoot Networks的2300万美元C轮融资。
随后在2018年,AI芯片公司——上海燧原科技有限公司获得了腾讯领投的Pre-A轮3.4亿元人民币投资。
2019年6月,腾讯跟投燧原科技的新一轮融资,在今年,腾讯又继续跟投了燧原科技的C轮融资。
据天眼查数据显示,2020年3月19日深圳宝安湾腾讯云计算有限公司成立。该公司经营范围就包含了集成电路设计、研发等。
然而对于造芯这件事,腾讯并非是以BAT为代表的大型互联网公司中的唯一一家。
早在2018年7月,百度公司发布云端全功能AI芯片“昆仑”,其中包含训练芯片昆仑818-300,推理芯片昆仑818-100。
目前,百度第一代昆仑芯片已于2020年初量产,目前已经规模化部署超过2万片,第二代昆仑芯片已经流片成功,将于2021年下半年量产。
而阿里巴巴在2018年9月的云栖大会上宣布成立平头哥半导体有限公司,主要任务是从事芯片的自研开发与战略布局。2019年9月阿里巴巴第一颗自研芯片——AI推理芯片含光800正式问世,阿里巴巴表示该芯片已经量产,服务于阿里巴巴内部。
“造芯”的初心,是为了打造一朵更高效的云
“随着云计算承载的业务规模越来越大,传统服务器难以完全满足云计算数据中心场景下对超大规模、需求多样、高性价比、安全可靠以及软硬件一体化等方面的要求。”
2020 Techo Park开发者大会上腾讯云服务器与供应链管理部总经理刘裕勋就曾对雷锋网表示到。
随着云计算产业的发展,从技术的角度说,云计算已经超过IT基础设施的范畴,正向上定义软件应用服务,向下定义芯片、服务器等IT硬件。
从技术角度来看,20年前,虚拟化技术实现了硬件细节的抽象,让基础设施成为由软件管理的单一实体。过去10年,云计算进一步推动了这一进程,使硬件成为一种抽象资源,而且对于客户来说,这个资源越来越多地由别人来管理。
然而,云计算技术虽然使硬件变得抽象,但实际上,云服务商却在硬件层面在做这大量的创新工作,开始从最基础的芯片来构建云。
同样,在刘裕勋看来,随着云原生理念的不断推进,云基础架构的演进过程中会呈现出三个特点:高复杂度、高性价比、安全性。
当海量业务承载在云基础架构设施的时候,业务的多样性,对于软硬件一体化的系统实际上提出了更高的要求。面临这样的复杂度,云厂商根据自身的情况,必然要开始自己进行研究相关芯片,或者是与其他芯片厂商联合起来进行深度定制,以此来解决各种复杂场景下的兼容性问题。
自研芯片的背后,则是对于BAT这般体量的云服务商而言,则是性价比最高的一条道路。
而在技术上,以英特尔的CPU为例,CPU的另外一个名字叫通用计算。而这也就代表着,搭载通用CPU的服务器具有很高的通用性,但是实际的应用中,势必会造成性能的浪费。
对于普通用户来说,可能十几上百台服务器就是应用的极限了,但是互联网大厂的服务器动辄就是上万甚至几十万台,因此每台性能的略微降低累积起来都是一个不得了的数字
更重要的是,由于互联网应用的特殊性,相当一部分新采购的服务器都要进行针对性的优化,或者需要进行部分配件的调整与革新,也就需要投入大量的人力、精力和财力,造成资源的浪费。
因此对于以腾讯云为代表的云厂商来说,势必要从整机的设计上面,去精简不需要的功能;优化整机的散热能力,降低能耗。配备一个非常强的供应链的管控。去降低计算力的单位成本,并进而将这种成本红利释放给数百万的云上用户。
而在安全方面,从芯片层面就进行自研、定制化,势必能更好的保证整机系统的安全可靠。
就在近日上海闭幕的世界人工智能大会上,华为轮值董事长胡厚崑表示道:“只有基础打得牢,根技术扎得深,应用创新跑得快,才有人工智能产业的参天大树和生态的持续繁荣。”
其中技术要扎到根,根深才能叶茂。值得就是应该大力发展根技术,如处理器、AI计算框架等,增强人工智能产业的发展韧性。
“硬件创新”已成云厂商必争之地
除国内云厂商之外,国外三家规模较大的云服务商亚马逊、微软和谷歌也硬件方面进行重金投入。用于提高自身云平台的性能或者调优服务来满足特定的用途,例如人工智能开发等等。
如谷歌把自己的云计算战略重点放在了处理人工智能工作负载上,为此设计了名为TPU的微处理器家族,号称相比GPU的成本更低性能更高。
对此,谷歌曾对外表示,2015年的时候在多层神经网络ResNet 50上训练一个深度学习模型的成本超过20万美元,而今天,成本比一杯咖啡还便宜。
此外,微软Project Olympus是一项针对微软基于OCP构建的云平台打造一系列服务器结构块的项目。AWS基于ARM的Graviton处理器从2015年开始开发,到现在已经在AWS EC2实例中实现普及。
“硬件专业化可以将延迟、性价比和功耗/性能比提高10倍,但多年来,大多数计算工作负载一直停留在通用处理器上,”AWS工程师James Hamilton在一篇博客文章中这样写道。亚马逊每年要安装一百多万个专用芯片,专门用于机器学习工作负载。
亚马逊的Nitro项目则是将硬件和软件结合,消除虚拟化的开销。
阿里云的神龙架构则也是通过芯片层面的,通过软硬件结合的方式,来降低虚拟化损耗,华为云的擎天、京东的京刚则也是通过同样的方式。
对此,刘裕勋对雷锋网表示到,云上的客户是非常的“挑剔”的,同时云计算市场的竞争也很激烈,客户都希望用低成本,高质量的产品,客户要求的苛刻会推动我们去做更多的变革和演进。
在此背景下,对于云服务商而言,通过自研服务器、自研数据中心技术、再到上层的IaaS、PaaS、SaaS平台的协同打造,势必是一条必须要走的道路。(雷锋网 (公众号:雷锋网) )
。