300万跟注英伟达,腾讯云走上了DPU的道路
来源:伯虎财经(ID:bohuFN) 作者:李下
看着隔壁的“云”齐换高管,一个发力政务云,一个准备做最聪明的云。腾讯还是一如既往地保持低调的姿态,默默地干起了最熟悉的事情。
5月11日,一家名叫云豹智能的半导体公司发生工商信息变更,新增了一些风险投资机构,其中有一家叫做广西腾讯创业投资有限公司,投了约12万,占股0.92%。
虽然广西腾讯创投投的钱少,但早在一年前的4月,另一家深圳市腾讯信息技术有限公司给这家半导体公司233万,占股29%,成为最大股东,并且在5个月后又追加了大概76万。
那么腾讯为何会追投这家半导体公司?这背后又跟云计算有什么关系?
用7.2分钟下注DPU
云豹智能,2020年在深圳南山区成立,创始人萧启阳,斯坦福大学电子工程博士,读博期间研究人工智能和神经网络,担任麻省理工学院讲座副教授时,研究网络和分布式计算。
2002年萧启阳在硅谷创立芯片公司RMI,应用在路由器、无线基站、安全设备和智能网卡上。2009年RMI被上市公司NetLogic公司收购,2011年萧启阳又促成世界芯片大厂博通收购NetLogic,并成为博通处理器和无线基础设施事业部大中华区总经理,直至2015年离职,萧启阳自己寻找创业方向。
在萧启阳离开博通的前一年,另一边的马云下了一个判断:世界正从IT时代转向DT时代(Data technology),数据将成为DT时代的命脉。显而易见的是,智能手机普及后,各类图文、视频的数据量正在呈爆发式增长,淘宝可能是互联网里最早一批感觉到的。
不过到了2020年,随着疫情爆发,全世界的公司都感觉到了这种数据量的压力。这年8月,萧启阳终于找到了自己的创业方向:DPU芯片,然后成立了云豹智能。
DPU(Data Processing Unit)即数据处理单元,被称为继CPU、GPU之后,数据中心场景中的第三颗重要的算力芯片,甚至有人认为,未来的服务器可以少得了GPU,但少不了DPU。要理解这个,还要从CPU说起。
CPU基于冯·诺依曼架构设计,不仅承担计算功能,还有存储、网络、安全等基础功能,这种雨露均沾的行为导致了CPU计算的核心能力被其它这些基础功能消耗掉,按照英伟达CEO黄仁勋的说法,在20%到30%之间。
所以后来,GPU(Graphic Processing Unit,图形处理器)把CPU从图形处理中解放出来,并且功能越来越强大(3D处理)。类似的可以类比到手机行业,最近今年手机厂商推出的ISP影像芯片。
相比GPU的“专一”,DPU就博爱很多。听名字就知道,“数据处理单元”将承担数据中心的功能,包括网络、存储、安全等,它的目标就是让CPU变得专一起来——好好做“数学”。
巧的是,云豹智能成立两个月后,英伟达在2020年秋季GTC大会上推出一款新型处理器,命名 DPU,并制定了相关的发展规划。2021年GTC 大会上,英伟达宣布“GPU+CPU+DPU”的“三芯”战略。
虽然云豹智能一出生就稀里糊涂地遭遇了一个强大的对手,但另一方面,英伟达也让DPU暴露在资本眼帘中。成立4个月时,云豹智能拿到了天使轮,2021年4月,又拿到了腾讯、红杉的融资,商业又一次演绎了雷军的至理名言。
如果说红杉是奔着风口来的,那深圳市腾讯信息技术有限公司不管是从名字,还是从持股来看都“居心叵测”。
天眼查显示,该公司由腾讯科技(深圳)全资控股,目前持有云豹智能约24%的股份,是第一大股东。公司经营范围看起来也非常简洁、舒服:网络、信息技术服务、技术研发和咨询等。
这时候就有聪明的看官问了,腾讯为何要投资一家半导体公司呢?做芯片风险不大吗?
首先,腾讯目前下注的总资金不过300多万,就算赌输了,也无伤大雅,大概稍微努力个7.2分钟就能赚回来了(2021年腾讯每日净利润6亿)。
那万一赌赢了呢?
DPU的应用场景非常广泛,包括数据中心和云计算、网络安全、高性能计算及AI、通信及边缘计算、流媒体等。就当下而言,数据中心和云计算是DPU的主要应用方向之一。
云豹智能的官网介绍页显示,“云豹智能是一家专注于云计算和数据中心数据处理器芯片(DPU)和解决方案的领先半导体公司。”
解决算力、存储等问题是DPU的初心,但也是云计算的目的所在。
智能网卡还是DPU?
2021年9月,北京召开了中国智能网卡研讨会,除了芯片厂商、网卡供应商、运营商外,几个云厂商也来了。
腾讯云智能网卡研发负责人任凯介绍说,2020年,腾讯研发第一代自研智能网卡“水杉”,第二代银杉预计于2021年年底发布,第三代智能网卡还在项目构建阶段,预计于2023年上线。
两个月后的腾讯数字生态大会上,腾讯发布了三款芯片,分别是AI推理芯片“紫霄”、视频转码芯片“沧海”、智能网卡芯片“玄灵”。
其中,玄灵用于云主机的性能加速,实现了主CPU 的零占用。根据腾讯云总裁邱跃鹏介绍,玄灵相比起业界产品性能提升了4倍。
可以看到,虽然叫智能网卡(Smart NIC,上个世纪就存在了),但就从目的和实现的功能上说,这与DPU是一样的——DPU是英伟达基于Mellanox的Smart NIC命名,增加了一些新功能。
不过针对这种见解,阿里云虚拟化技术总监张献涛并不认同:从架构上来说,DPU架构是在DPU上插入一台服务器,智能网卡架构是在服务器上插入一个网卡。
理解这个,大概就明白为什么英伟达提出DPU后,会引发一阵DPU热潮。
目前来看,真正实现大规模商用DPU架构的,全球只有两家:亚马逊的AWS,以及阿里云。
2017年4月,随着云计算业务规模的扩大,资源争抢、算力损失的问题愈发突出,由此,神龙(X-Dragon)应运而生,通过虚拟化来达到转接CPU存储、网络等基础功能的目的。很快,阿里云就把天猫双十一当做试验场并成功运营,后来上汽成了第一家神龙架构的试验客户。2019年,阿里的所有业务迁至神龙架构。
在解放CPU算力这块,京东云迈的步子跟阿里云有点像。2021年2月,京东云正式发布了自研的虚拟化架构“京刚”。据介绍,京刚架构已经成功应用于京东双十一、京东健康疫苗预约与核酸检测等业务场景,顺利地扛过了高峰值的性能瓶颈问题。
而去年刚加入云计算的新成员字节跳动,不久后也宣布将自研DPU,计划通过火山引擎云产品的方式对外服务。
那么,发展这么多年的智能网卡到底与成熟的DPU有多少差距?起步阶段的DPU芯片有多少泡沫成分,未来又会面临多少技术难题?这些都不知道。但针对一个新概念,尤其一个世界科技巨头推出的概念,最好的办法就是跟注。
这是腾讯在做的,也是百度在做的。今年2月,百度全资控股的关联公司战略投资了一家成立于2021年的DPU芯片研发商星云智联(珠海),未披露金额。
(图源:天眼查)
不过,需要提醒的是,在英伟达推出DPU的概念并成功与CPU、GPU搭上亲戚关系而走红后,带火了一大批DPU初创企业,当中也有一些企业打着DPU的旗号给“智能网卡打补丁”的(阿里云张献涛说的)。
云计算的排位赛
自2019年腾讯公布云服务收入170亿后,近两年年报,腾讯不再单独公布云服务收入。2021年,并入金融科技及企业服务的云服务收入加起来一共是1722亿,增长了31%。
从一些调研机构统计出来的数据来看,2020年,腾讯云在国内“IaaS+PaaS”公有云市场份额为12.6%,位居第二,相比第三的华为云高2.1%(艾瑞咨询)。
(艾瑞咨询数据)
到2021年上半年,腾讯云在国内“IaaS+PaaS”公有云市场份额为11.2%,比华为云高0.3%,位居第二(IDC);2021年Q3,同类的市场份额为10.9%,比华为云高0.2%,稳居第二(IDC)。
虽然同样是国内云计算的第二名,但与第三名的差距逐渐拉小。
另外,根据中商产业研究院的数据,2021年全年,腾讯云市场份额16%,被华为云(18%)超过。
虽然以上数据来源不同,具体的统计方法也不得而知,但是总体的趋势是可以看见的。
阿里云凭借自己的先发优势会在国内云计算的第一把交椅上盘踞几年,暂时无人能撼动。排名会产生剧烈变动的是那些市场份额差距较小的主体上,比如腾讯云与华为云现在所处的境况。
显而易见的是,华为过去几年凭借政务云上的优势,市场份额正在蹭蹭蹭地上升。腾讯云依赖的游戏、直播等互联网生态,目前正在遭遇行业寒冬。
在互联网行业增长见顶的情况下,越来越多的企业正在涌入云计算,蚕食这个千亿市场。以DPU为代表的技术更新,对云计算企业的未来发展是一种潜在的机会或者风险,云计算的排位赛正在火热进行中。
参考来源:
1.芯东西:独家对话阿里云张献涛:自主最强DPU神龙的秘诀
2.深燃:硬科技创业潮:人均博士、技术造富、VC排队送钱
*文章封面首图及配图,版权归版权所有人所有。若版权者认为其作品不宜供大家浏览或不应无偿使用,请及时联系我们,本平台将立即更正。