新华三曾富贵:应用与AI双轮驱动,演绎智能时代的“算力×联接”
AI产业发展如火如荼,百态千模激战正酣、算力集群规模指数增长, AI与产业和用户的联接方式也花样百出。在这样百舸争流的背景下,算力与网络的融合发展正成为产业和用户关注的焦点。新华三集团高级副总裁、网络产品线总裁曾富贵认为:“在算力需求空前繁盛的当下,算力生态多元化已成必然趋势,联接技术的创新也要与之相辅相成。一方面,网络要具备标准开放的能力,以解决算力扩张的问题,让成千上万张计算卡能够化零为整,继而以算力的量变促成大模型的质变;另一方面,网络更要积极拥抱AI技术,让用户享受到技术多维进步所带来的收益。”
新华三集团高级副总裁、网络产品线总裁 曾富贵
应用与AI双轮驱动,AD-NET进入7.0时代
应用驱动网络( Application-Driven Network )是新华三多年来在网络领域践行的技术理念,并基于此打造了众多覆盖数据中心、园区网和广域网三大场景的拳头产品。名称中的AD意为“Application Driven应用驱动”,在过去的数年间,体现了新华三在数字时代重视业务应用和用户体验的核心思路;而在全新的智能时代,新华三正通过AI及各类先进技术的综合运用,让AD-NET内涵升级为Application Driven + AI Driven,用“双A驱动”实现用户收益的倍增,为行业构筑新时代的智能底座。
为满足广泛出现的智能化需求,新华三用新技术、新产品、新思路建立起了一套以网强算、以算提智、以智增效的“网、算、智”正循环。AD-NET 7.0通过内置灵犀大模型已全面具备AI能力,结合新华三网络设备内嵌的NAI智原生技术,帮助用户提前享受到AI技术所带来的多重便利。由此,Application Driven和AI Driven的双A驱动也能在用户的业务场景中互为动力,为用户带来更长期、更强劲的价值收益。
数据中心:为异构GPU智算集群打造开放的智算网络
网络是构建AI智算中心/集群的关键,但传统数据中心却面临极大的技术挑战。
一方面,系统内部一对多、多对多的数据流时常出现,其所导致的网络丢包情况已经难以通过单纯提升端口带宽的方式来避免;这极大阻碍了集群规模的进一步提升。很多用户只能退而求其次,用更封闭、更昂贵的Infiniband网络来避免丢包和集群效能损失。
另一方面,越来越多厂商开始推出GPU加速卡产品,不同GPU会使用不同的通讯库,而Infiniband由于其封闭性,无法全面兼容不同厂商的GPU产品。
面对左右为难的困境,新华三的解决之道有三:一曰“扩路增容”,即进一步推高网络的端口带宽,让网络有能力应对更大规模的数据传输;二曰“分拆增量”,即打破交换设备的机框限制,让用户能够通过多种组网形式来获得更多端口数量,继而组建更庞大的算力集群;三曰“均衡增效”,即创新性地引入具备信元级负载均衡能力的DDC(Disaggregated Distributed Chassis分布式解耦机框)网络架构,在软硬件解耦的同时实现高效率的负载均衡,使智算中心性能表现更上一个台阶。三头并举,新华三推出全新智算网络解决方案。
首先,智算网络解决方案为用户提供不同端口密度、形态丰富的交换机产品,可应对更大规模的突发流量,提高了带宽上限。其次,新方案可提供单框单层、盒-盒两层、框-盒两层等众多组网形态,能为智算中心和集群提供更多端口,更有利于集群扩容。第三,方案核心产品H3C S12500AI系列交换机所采用DDC网络架构,能够提供信元级负载均衡能力,确保100%无损传输,结合LBN端口对称负载均衡、DLB动态逐流负载均衡、FGLB全局动态负载均衡、SprayLink动态逐包喷洒等不同的负载均衡技术组合,可全面满足不同智算场景的网络调优和流量均衡目标。无论节点是否支持智能网卡,新方案都能彻底解决网络拥塞所导致的丢包问题。
由此,新方案便可基于标准化的以太网技术堆栈,保持架构的开放兼容;同时也解决集群效率问题,为算力规模的进一步成长铺平道路。
园区网:从接入体验出发,打造智快至简的全光网络
新华三是园区网全光趋势的参与者和推动者。通过以太全光+PON融合的技术路径,不仅大幅提升了接入层用户带宽,更可进一步降低园区网的能耗和TCO,提升全网使用寿命。另一方面,新华三看到园区网的技术发展进程实际上已经领先于应用对网络性能的刚需,所以将更多AI创新技术引入园区网,通过更加精细化的粒度提升运维管理效率和体验,打造一张智快至简的园区网。
基于AI技术,新华三能实现园区网的端到端应用体验可视。由此,运维人员便可通过动态更新的园区网数字地图来主动感知网内海量终端和业务的接入及用网情况,为最终的应用体验持续改善保驾护航。
在简化管理方面,新华三则推出了轻量化园区BRAS(Broadband Remote Access Server)和融入无线4i技术的Central AC解决方案,可大幅简化有线无线用户策略的管理复杂度,降低运维工作量,实现随需而动的园区策略管理和始终如一的园区用户体验。
而在接入领域,新华三一方面正在积极推进FTTD接入产品、场景化Wi-Fi 7 AP和工业交换机的新品上市速度,为用户提供更多样的接入层设备,提升全光网络的场景适应性;另一方面,针对全光施工部署的实际需求,新华三也推出了光纤速熔技术,大幅简化布线的工序数量和耗时。
通过运维、管理和接入、布线领域的多维创新,新华三园区网方案便可进一步提升全光园区网的运管和用网体验,促进算力与业务的深度融合,让智能体验顺着网线和Wi-Fi触及边缘业务和每一个人。
广域网:以400G高速广域网实现算力智享
算力需求可以出现在百行百业之中,但智算中心的建设却有诸多限制。因此,如何以广域网方式联接智算中心和业务需求就成为用户关注的重点领域。新华三认为,带宽、算法和可靠性仍是构建广域算力网络的关键点。
以主力的CR19000、CR16000E-F等核心路由产品为例,新华三做了三点升级:
其一,提供更高的400G转发速率,并利用确定性网络技术大幅降低广域网的延迟和抖动。通过使用DetNet、DetNetOAM等技术,新华三路由器可实现城域1毫秒、区域5毫秒、核心20毫秒的超低传输延迟,以及低至15微秒网络抖动幅度,大幅提升算力网络品质。
其二,新华三也将算力因子融入了网络设备内嵌的路由算法,使广域网天然适用于传输算力。
其三,让用户能够按需构建专用算力通道,为用户提供服务化的算力专线。通过参数可选、随用随建、自动化建网、用完即拆、带宽动态调整等一系列特性,新华三路由器可进一步提升算力网络的资源利用率和网络SLA。
三重进化之下,跨域算力调度便可进入真正的实用阶段,让用户能够以更低的成本,更自由、更灵活的获取智能算力、布局智算业务,实现普惠型算力服务,使算力产业获得更广阔的发展空间。
智能运维再升级:用大模型应对多重挑战
在更高级的运维管理和安全层面,新华三则在积极推进大模型技术与传统ICT运管及安全方案的深度融合。而灵犀大模型就是新华三数十年ICT领域运维经验和上万名专家的智慧结晶。
以网络运维管理为例,灵犀大模型支持的灵犀助手可综合全网的运行状态数据实现AI可视、AI排障、AI调优、AI安全等一系列功能,降低网络运维及安全工作的门槛、减少运维人员人工操作工作量、提升网络自动化水平,将用户从繁杂的基础工作中解放出来。
除智能运维外,灵犀助手还集成了知识问答、配置指导和产品推荐等功能,可以帮助用户更好的理解、使用新华三产品,并为网络架构的持续发展演进提供参考。
以高品质网络联接,构建行业智能底座
无论是过去的信息化时代,还是如今的数字化、智能化时代,无论是建设云计算中心,还是如今的智算集群、智算中心,无论在数据中心网,或是园区网、广域网;网络所联接的都是算力和存力、业务与用户。而当基础架构的规模愈发庞大、性能愈发强悍、体系愈发复杂,网络技术也必须同步、甚至超额进化,由此,整套ICT架构才能在管理、效率、可靠性等方面达到预期,为用户提供与时代相匹配的业务体验。
作为网络进化的推动者,新华三要做的就是不断用新技术、新思路、新方案拓展网络联接的上限,将松散的ICT要素夯实为智能底座,为用户业务的向上发展筑牢根基。这条道路充满挑战、永无止境,但新华三始终奋力向前、力争上游。