DPU在通信云里的重要角色:中国联通白皮书解读

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

8月24日,中国联通联合中兴通讯股份有限公司(下文简称“中兴通讯”)及深圳云豹智能有限公司(下文简称“云豹智能”)在紫金山实验室主办的第七届未来网络发展大会上发布了《中国联通DPU网络域场景应用白皮书》,深度解析了DPU在通信云尤其是NFV(Network Function Virtualization, 网络功能虚拟化)领域的重要角色。

DPU在通信云里的重要角色:中国联通白皮书解读

《中国联通DPU网络域场景应用白皮书》发布

目前通信行业借鉴云计算的成功经验,在5G网络中引入了NFV架构,将传统软硬一体的专用网设备升级为基于通用设备的云计算资源池,真正实现网络功能的快速部署、灵活调度和资源优化。

本白皮书由运营商(中国联通)、通信云平台(中兴通讯)和DPU芯片企业(云豹智能)联合重磅推出,是关于DPU( Data Processing Unit, 数据处理器)在通信云应用的第一篇白皮书。

DPU作为继CPU和GPU之后的第三大核心基础性算力大芯片,之前已有很多解读文章,不过大部分集中在公有云场景,譬如CPU算力卸载和降本增效等。而这篇白皮书肯定了DPU在运营商网络域NFV体系架构中的价值,阐述了当前网络域云基础设施所面临的几个痛点,在分析了DPU技术优势的同时,也给出了DPU针对这些痛点所对应的解决方案以及在几种典型网络域业务场景中的应用方案,并着重阐明了DPU作为一种新型计算技术在NFV技术演进中的重要作用;白皮书最后还对DPU所面临的挑战和发展建议进行了一些思考和讨论。

白皮书中指出,随着5G在垂直行业的应用和AI大模型、短视频等业务的发展以及各种新型通信服务如 VR /AR、车联网、数字孪生、智能内生、安全内生等应用的崛起,对算力资源的利用效率和性价比提出了更高的要求。面对日益复杂和多样化的需求,NFV需要进行软硬件解耦,从而将网络功能从专用的硬件设备中释放出来,通过软件定义的方式将这些网络功能部署在通用的服务器、存储和网络设备上,从而实现更高的灵活性、可扩展性和可定制性。

针对网络域NFV面临的如下问题:

l 虚拟化层功能需要占用大量CPU资源,存在资源损耗;

l 通信场景中的一种主要业务是针对用户面网络报文进行处理转发,根据用户业务特征,有高带宽、低时延等要求,通常需要硬件加速技术优化转发性能指标,但现有云资源池缺少硬件加速能力;

l 业务应用与云资源池基础设施之间缺少物理隔离,存在安全隐患;

l 单一的通用虚拟机资源池难以满足各类业务应用的统一建设和运维需求。通信场景业务丰富,不但有5GC、IMS等核心网主业务能力应用,还有IP短信、炫铃、5G新通信等创新业务应用,各类业务应用对资源的需求、产业生态差别大。

DPU依托自身灵活通用可编程、资源管理、算力卸载、网络/存储/安全加速引擎等技术的能力和特点,对以上问题均提供了有效的解决方案。


通用可编程特性

这篇白皮书中也指出,纵观DPU架构和技术发展历程,可以明确看到DPU SoC(System-on-Chip)是当前国外头部云服务提供商和DPU厂商的主流技术路线。早在2015年,全球最大的云服务商AWS(亚马逊云)收购半导体公司Annapurna开发DPU SoC芯片,开启了DPU应用的序幕,由于当时 商业 市场及其他云服务商均没有成熟的DPU SoC芯片,因此DPU在云厂商的应用经历了基于CPU+FPGA的百家齐放阶段;现在放眼全球DPU技术的发展,可以看到以亚马逊、Nvidia、Intel和AMD等为代表的头部企业都陆续通过自研或并购的方式在DPU SoC上进行研发投入。例如,AWS最早研发DPU SoC芯片,其不仅占据全球云计算市场最高份额,而且多年前已最先实现了DPU SoC(AWS称之为Nitro)商业化的成功部署;Intel与Google合作开发Mount Evans系列的DPU SoC;Nvidia于2020年以69亿美元成功收购业内知名网络芯片和设备公司Mellanox,通过融合Mellanox的网络技术,快速面向全球数据中心市场推出BlueField系列的DPU SoC;AMD于2022年以19亿美金收购了DPU SoC厂商Pensando。全球头部厂商纷纷布局DPU,代表了DPU已成为其重要战略部署之一,这也再次印证了DPU已成为业界三大核心基础算力芯片的事实。  

虽然目前国内云厂商大部分还是基于CPU+FPGA的DPU解决方案,这些方案在研发投入上拥有一定的时间优势,但因其功耗过高及性能受到限制,并未达到新一代云计算的要求,这一矛盾在网络域NFV部署落地中显得尤为突出。对于国内电信运营商来说,如果业界有一款商用的有足够竞争力的DPU SoC,其将毫无疑问地从CPU+FPGA的DPU解决方案升级到DPU SoC方案。

另外,从如何将DPU功能快速引入现有NFV软件编程框架,如何应对灵活多变的软件功能迭代需求上讲,该白皮书提到DPU中可编程网络处理引擎也面临着如何持续演进并满足软件侧持续迭代开发带来的新需求和新挑战。而P4作为可编程网络领域的主流语言,相较于传统的通过驱动API暴露硬件能力的方式,P4在语言层面提供更高的灵活性,在全面地暴露所有硬件能力的同时,还将过往依赖厂商私有API/SDK暴露硬件能力的方式转变为由终端用户去定义硬件数据面转发能力,让用户真正实现软件定义硬件和差异化。另一方面对比Verilog/VHDL电路行为级别的编程语言,或者C/C++等通用计算编程语言,P4语言对网络应用业务的开发提供了更高层次的抽象,大大降低了程序开发的门槛及复杂度,也提高了开发效率。因此支持P4可以有效降低DPU的使用门槛,加速和简化DPU在现有编程框架下的快速引入;通过 P4来支持DPU的灵活可编程成为了业内的趋势。。

根据SDNLAB的了解,目前云豹智能是国内唯一一家推出高性能DPU SoC产品的公司,其产品也将是国内第一款通用可编程DPU SoC芯片。其自研的DPU SoC芯片不仅提供高达400G的数据吞吐能力,还搭载性能强劲的CPU处理单元并配合多种可编程的数据处理引擎实现层级化通用可编程能力,提供完整的P4工具链支持,也是国内第一家成功在DPU上落地完整支持P4的DPU厂商。 根据该白皮书的描述,云豹智能在DPU多个关键领域掌握并引领着多项核心技术。

本白皮书是继中国移动和云豹智能深度合作DPU白皮书之后,中国联通作为另一支国家队发布在DPU场景应用上的重磅白皮书;云豹智能也是中国联通邀约参与撰写的唯一一家DPU企业。

当前,国内运营商网络是DPU应用的巨大潜在市场,包括三大运营商,其每年服务器增量,保守估计在二十几万台/年。作为国家三大运营商之一,中国联通希望通过本白皮书的发布引起行业的共同深入思考,为业界开展基于DPU技术的NFV演进提供参考,加速推进DPU和通信产业发展,助力安全、绿色、灵活的5G网络建设和“万物智联”的6G愿景实现。可以预见,随着运营商与DPU厂家的深入合作,DPU将会在NFV架构演进中发挥重要的作用,逐步构建基于DPU技术的运营商网络域的新一代网络架构。

随意打赏

提交建议
微信扫一扫,分享给好友吧。