倚天不出谁与争锋 阿里平头哥首颗云芯片诞生背后
10月19日,阿里巴巴旗下半导体公司平头哥首款自研服务器芯片倚天710的亮相,成为2021云栖大会现场的“大事件”。
倚天不出谁与争锋!5nm制程、3.2GHz主频,性能超过业界标杆20%,能效比提升50%以上……这颗被视为“地表最强”的ARM服务器处理器,颇有剑锋所指、所向披靡的气势。
倚天710的问世,意味着平头哥已具备大型复杂芯片的研发设计能力,跻身世界一流芯片设计公司的行列,阿里“造芯”攻克关键一役。同时,进一步构建和完善了阿里云“端云一体”的芯片生态,在这颗为云而生的“强U”加持下,阿里云“一云多芯”策略迈出关键一步。
首颗5nm服务器芯片 双11率先部署应用
倚天710是首款采用业界最先进5nm工艺的ARM服务器处理器,其单芯片容纳高达600亿晶体管;在芯片架构上,基于最新的ARMv9架构,内含128核CPU,主频最高达到3.2GHz,能同时兼顾性能和功耗。在内存和接口方面,集成业界最领先的DDR5、PCIe5.0等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。
据集微网了解,为解决云计算高并发条件下的带宽瓶颈,倚天710针对片上互联进行了特殊优化设计,通过全新的流控算法,有效缓解系统拥塞,从而提升了系统效率和扩展性。在标准测试集SPECint2017上,倚天710以440分登顶,性能超出超过业界标杆20%,能效比提升50%以上。
作为通用芯片,CPU是半导体行业设计门槛最高的芯片之一,全球范围内具备这一技术能力的企业本就屈指可数,而能设计出顶级性能的CPU公司更是凤毛麟角。
目前,服务器芯片最先进的工艺仍为7nm,5nm工艺对能量密度、芯片内部结构的布局有极高的要求,在研发过程中极具挑战。
从这个角度而言,倚天710傍身的ARMv9、DDR5、PCIe5.0等,都是业界最为领先的技术架构和标准,平头哥对此进行了深度定制,同时也引入了许多自研技术,从而实现了在5nm通用芯片设计研发上的突破,研发实力凸显。
据平头哥方面介绍,倚天710从前端架构设计到后端物理实现均为自研,其中既要克服工艺以及IP不成熟带来的困难,又要针对云场景的独特要求做定制化设计,技术上保障性能、功耗的均衡。
在前端设计方面,为解决核数众多条件下的带宽瓶颈,平头哥对于片上互联作出特殊优化,采用新的流控算法,降低系统反压,有效提升了系统效率和扩展性,使单核高性能有效地转化为整个系统的高性能。此外,通过新的系统地址到DRAM地址的转换机制,支持安全、非安全隔离、多NUMA、异常通道隔离多种特性,同时DRAM读写效率大幅度提升。
在后端物理实现方面,平头哥灵活调度多达30种不同EDA软件、深度定制时钟网络和定制IP技术,此外还采用了先进的多芯片堆叠技术,最后成功确保了芯片性能、功耗的优化。
据集微网了解,倚天710即将在阿里云数据中心部署,将率先在今年双11应用,并逐步服务云上企业。
苦练内功三年 平头哥跻身世界一流
2018年,阿里巴巴全资收购大陆唯一拥有自主嵌入式CPU IP core的中天微,由此掌握了芯片底层技术的能力。2018年云栖大会,达摩院芯片研发团队与中天微团队合并成立平头哥,平头哥一跃成为全球为数不多同时拥有处理器IP及芯片设计能力的芯片公司。
在处理器IP方面,平头哥核心团队拥有十年以上的CPU IP和芯片研发经验,长期从事自研指令集架构、CPU微体系结构与系统芯片产品的研发。在云端芯片方面,背靠全球前三的云平台阿里云,平头哥能深刻理解数据中心业务场景和需求,因此能够更高效地研发业界一流的芯片。
在上述优势的基础上,成立三年来,平头哥苦练内功,积累起丰富的AI芯片及处理器IP设计经验,并快速推出多款创纪录芯片类产品,不断给业界带来惊喜,持续的投入以及快速产品迭代,为其突破通用芯片研发技术奠定了基础。
2019年7月,平头哥发布当时业界最强性能RISC-V处理器玄铁910,意味着基于RISC-V架构的高性能芯片成为可能,也让芯片设计的门槛进一步降低。目前,平头哥累计开发了十多款玄铁系列嵌入式CPU IP核,已得到大规模量产的验证,累计出货量超过25亿颗,更引领了芯片行业的一股新趋势,如今,国内外 科技 企业纷纷涌进RISC-V技术的研发。
在2019年9月举行的云栖大会上,平头哥发布阿里首颗AI推理芯片含光800,针对场景深度定制,创造了性能和能效比的两项第一,目前已应用于搜索推荐、视频直播等场景。
通用服务器CPU芯片是数据中心最复杂的芯片之一,其架构设计复杂,对性能、功耗要求极高,截至目前全球仅有少数企业具备这一技术实力,Intel、AMD、AWS以及阿里平头哥等少数公司在此之列。 倚天710芯片的研制成功,并实现了性能上的极大突破,标志着平头哥已经具备大型复杂芯片的研发设计能力,跻身世界一流芯片公司的行列。
同时,倚天710芯片的推出也意味着平头哥产品家族的不断完善。其中,玄铁系列为AIoT终端芯片提供高性价比IP;AI芯片含光800通过阿里云为人工智能场景提供极致AI算力;通用服务器芯片倚天710则通过阿里云为云上客户提供差异化的顶级算力。
阿里造芯有成 端云一体优势凸显
2009年,阿里巴巴启动了飞天云操作系统的研发,并成立阿里云。过去十二年,阿里云持续深耕自研技术,成功打造世界前三的云基础设施,也为阿里研发基础技术、前沿技术打下了坚实的基础。
芯片是计算系统的核心,云是高性能服务器芯片最大的应用场景。 阿里巴巴集团横跨电商、物流、云计算、大数据、全球化等场景,拥有世界上最挑战、最丰富的计算场景、网络场景、机器学习场景,需要使用大量芯片,自研芯片能够降低阿里巴巴集团内部整体计算的成本。
而基于云的技术体系建设,需要从软件到基础硬件层面的不断探索,“从芯到云”的自研能力打造,也有助于阿里云打造出差异化的竞争优势,满足数据中心等市场日益多样的客户需求。
2017年,阿里成立的达摩院,向芯片等硬科技领域进军,致力于实现芯片、服务器、交换机等全栈技术的自研。2018年平头哥的成立,则成为阿里造芯的有力抓手。
和绝大多数芯片企业不同,平头哥的目的并非售卖芯片,主要供阿里云自用,助力阿里构建起端云一体的芯片生态,也显着提升了阿里在云计算、数据中心市场的竞争力和服务能力。
此次倚天710的推出,进一步丰富了阿里云的底层技术体系,目前,阿里云已全面兼容x86、ARM、RISC-V等主流芯片架构。同时,这也是阿里自研芯片和自研飞天操作系统的一次深度协同,从底层芯片、云操作系统到存储、网络、数据库系统,阿里云成为中国唯一实现全栈自研的云计算平台。
这为阿里云向云上企业提供顶级云计算服务创造了绝佳条件,云上企业的成本将进一步降低。
据阿里云智能总裁、达摩院院长张建锋介绍,基于阿里云“一云多芯”和“做深基础”的 商业 策略,发布倚天710希望满足客户多样性的计算需求。同时将继续与英特尔、英伟达、AMD、ARM等合作伙伴保持密切合作,为客户提供更多选择。
更重要的是,倚天710的推出,也是中国芯片事业的一大突破。长期以来,中国芯片长期依赖于进口,仅2020年芯片进口额就达到2.4万亿元,尽管中国企业正在快马加鞭努力补齐芯片设计的短板,但在高性能CPU市场几乎没有太多建树,如今,以阿里为代表的企业正在试图逐步扭转高性能芯片长期落后于人的局面。
开源玄铁 推动RISC-V生态创新
此次大会上,除了倚天710的发布之外,平头哥还宣布玄铁RISC-V系列处理器开源,并开放相关工具及系统软件。
这是继发布玄铁910等处理器后,平头哥在RISC-V生态上的又一重要举措,也是全球首个商业处理器的开源,进一步拉近了RISC-V技术与开发者的距离,成为全球硬件开源的新里程碑。
得益于灵活、精简及开源等特点,如今,RISC-V架构已成为芯片产业链的主流选择,但相比传统芯片架构,RISC-V生态的配套软硬件及工具仍然较为稀缺,这极大地限制了开发者在RISC-V生态上的创新。
此次平头哥宣布对玄铁RISC-V处理器系列开源,并将持续提供技术和服务更新,有助于帮助企业和开发者从开源中真正落地,走向商业成功,共同繁荣“云端一体”的AIoT生态。
可以看到,在一方面坚持自研芯片的同时,平头哥也在积极拥抱开源,特别是对于正在上升期的RISC-V架构技术而言,只有更多的开发者和企业使用,才能共同推进生态进步,真正让这一技术在芯片和操作系统等软硬件层面实现繁荣,平头哥也会从中受益。
服务器芯片发布、玄铁系列处理器开源,阿里的软硬一体化、端云一体化战略逐渐清晰。作为构筑这一战略的核心,达摩院、平头哥及阿里云,正在成为阿里巴巴三位一体的核心技术栈,未来将创造出更多的突破性成果。
在笔者看来,平头哥苦练内功三年多,目前取得了阶段性的成果,这是阿里巴巴十年如一日坚持科技战略、坚定科技投入的结果。从云、AI、自动驾驶到芯片,阿里在多个前沿技术领域深度布局,开花结果。
“阿里过去一直都是、未来也会一直把科技当成核心驱动力,坚持技术自研,持续加大投入,解决前沿科技和基础科研的重要难题,参与到国家社会的科技创新、技术攻关工作中。”阿里方面告诉集微网。
【来源: 集微网 】