英伟达、英特尔和 AMD, 联手投出一家「芯片独角兽」
两天前,英伟达创始人黄仁勋在 CES 上发布了公司一系列 AI 新产品和解决方案,为人工智能的算力和应用落地提供更多「弹药」。在抓紧生产现有架构的 AI 基建硬件时,这家巨头早已经瞄准了下一代技术。
不久前,英伟达联手老对手英特尔,投资了一家初创公司 Ayar Labs。新一轮 1.55 亿美元的融资,也让 Ayar Labs 成为芯片领域的新一家独角兽公司。
这家公司是什么来头?为什么能让芯片三巨头打破障碍联合投资 ?
Ayar Labs 主攻光学互连解决方案,其解决方案能以 AI 运作的速度移动数据,以满足客户对可扩展、经济高效的 AI 基础设施的迫切需求。
对此,Ayar Labs 联合创始人兼 CEO 马克·韦德表示,「领先的 GPU 提供商 AMD 和英伟达以及半导体代工厂格芯、英特尔代工、台积电,再加上 Advent、Light Street 和我们其他投资者的支持,凸显了我们的光学 I/O 技术重新定义 AI 基础设施未来的潜力。」
「光学 I/O」是什么东西?Ayar Labs 又能解决快速发展的 AI 领域的什么问题 ?
01
精英团队
Ayar Labs 在 2015 年成立,总部位于加州圣何塞。
起初公司由四位 MIT 学生在 2015 年共同创立,其中 Mark Wade、Chen Sun 和 Vladimir Stojanovic,当时分别是 MIT 电子工程专业的博士生和访问学者,目前分别担任公司的 CTO、首席科学家和首席架构师。随后,他们邀请了当时正在攻读 MIT MBA 的 Alex Wright Gladstein 加入团队,担任 CEO。
现在,团队由来自英特尔、IBM、美光、Penguin、麻省理工学院、伯克利和斯坦福的许多顶尖技术专家组成。
成立以来,Ayar Labs 一直深耕于光学互联解决方案领域,市场战略重点是解决光电子领域的大批量、高质量制造问题。
公司成立次年获得了 2 百万美元的种子轮融资,而最新一轮顶级芯片制造商的投资正是该公司技术走向成熟的标志。新的资金将用于扩大芯片生产规模,促进生成式 AI、分解数据中心等的发展。
Ayar Labs 的发展历程 | 图片来源:Ayar Labs 官网
正如,Ayar Labs 首席执行官兼联合创始人马克·韦德,今年 10 月在采访中表示「客户已经在试用 Ayar Labs 的芯片,在过去的 18 个月里,出货超过 15,000 台,这为我们在 2026 年年中至 2028 年年中的两年重点窗口期实现批量生产奠定了基础。」「我们预计月产量将达到数十万到数百万个,到 2028 年及以后,年产量有可能超过 1 亿个。」
目前,Ayar Labs 的芯片由 GlobalFoundries(起初为 AMD 公司的制造部门,后来成为独立公司)制造,并且已经与所有一级 CMOS 制造商建立了合作关系,与 GlobalFoundries、Applied Materials、台积电、英特尔和英伟达等主要厂商建立了战略合作关系,将光 I/O 解决方案整合到其制造产品中。
对此,Ayar Labs 曾官方宣布,「我们正在建立一个强大的生态系统,其中包括重要的战略技术和供应链合作伙伴。我们还积极参与多个行业和标准组织的活动,推动光学 I/O 芯片生态系统的发展。」
Ayar Labs 强大的生态系统 | 图片来源:Ayar Labs 官网
02
解决 AI 数据瓶颈
随着生成式 AI 模型的复杂性和规模指数级增长,对大型计算集群的需求日益增加,这些算力设施通常需要连接数百甚至数万个 GPU 及其他加速器,以提供 AI 所需的内存和计算资源。
然而,AI 基础设施的扩展正面临带宽、延迟和功耗的挑战,这些挑战主要是由传统基于铜的互连技术造成的瓶颈。在连接超过 1.5 米距离和 72 个 GPU 的机架时,传统电互连技术尤其会遇到性能瓶颈和限制。
数据传输瓶颈限制了 GPU 的效能,导致投资收益递减。具体来说, 单个 GPU 的运行效率可达 80%,但扩展至 64 个 GPU 时可能降至 50%,进一步扩展至 256 个 GPU 时可能只有 30% 。
这不仅降低了整体系统效率,而且严重阻碍了数据中心性能的全面提升,限制了 AI 技术的进步。
根据高盛最近发布的报告预测,未来十年,AI 基础设施支出预计将超过 1 万亿美元。这凸显了对消除传统互联造成瓶颈的解决方案的迫切需求。
为了应对这一挑战,Ayar Labs 推出了业界首个封装内光 I/O 解决方案。
Ayar Labs 光 I/O 解决方案的创新之处在于其整体封装设计。 该设计允许光学模块直接与芯片集成,实现节点的大规模直连,有效克服了 I/O 密度、数据速率扩展和互联功率效率的限制 。
与传统的可插拔光学器件和电气 SerDes 互连方式相比,Ayar Labs 的光 I/O 解决方案可实现 5~10 倍的更高带宽、4~8 倍的能效,并将延迟降低至 1/10,最大限度地提高 AI 基础设施的计算效率和性能,同时降低成本、延迟和功耗,显著提升 AI 应用的盈利指标。
对比传统互连,Ayar Labs 的光 I/O 解决方案的优势 | 图片来源:Ayar Labs 官网
不仅如此,光 I/O 解决方案遵循 UCIe、CXL、CW-WDM MSA 等开放标准,并针对 AI 训练和推理进行了优化,其强大的生态系统使其能够顺利地大规模集成到 AI 系统中,进而提升生成式 AI 应用的性能和效率。
Ayar Labs 的光 I/O 解决方案特别适用于下一代 AI 扩展架构,这种架构需要超高的带宽和跨数百甚至数万个 GPU 的连接 | 图片来源:Ayar Labs 官网
03
「光 I/O」初探
Ayar Labs 的光 I/O 解决方案结合了两项行业首创技术——TeraPHY 光学 I/O Chiplet 和 SuperNova 多波长光源。
TeraPHY 光学 I/O Chiple 是业界首款封装内单片式光学 I/O 芯片。
它主要负责光电信号之间的转换和收发,是一种用于替代传统的铜背板和可插拔光学通信的小型化、低功耗、高吞吐量的解决方案。
它首次将硅光子技术与标准的 CMOS 制造工艺结合起来,将光学互联与与电子 GPU 或 CPU 集成在同一封装内,可以无缝集成到客户的系统级封装 (SiP) 架构中,使专用集成电路(ASICs)能跨越从毫米到千米的距离进行无缝通信 ,最大限度地减少信号损失和延迟,这对于分布式 AI 系统和云计算环境格外有用。
这一创新组件包含了约 7000 万个晶体管和 10,000 多个光学器件,主要包含了以下几个模块:
Grating Coupler Fiber Coupling Array:负责光信号的输入输出。
Optical Transceiver:主要负责进行光电信号的调制转换,主要由微环调制器(Micro-ring Modulators)和微环滤波器(Micro-ring Filter)组成,前者负责调制出所需的光信号,后者负责处理接受的光信号。值得一提的是,微环调制器正是 TeraPHY 的核心优势,鉴于它成功解决了成功解决了温度敏感性和信号稳定性问题,实现了在 15-100°C 温度范围内准确输出特定波长的光信号;
AIB:负责和芯片之间的电信号互联;
Glue/Crossbar:是 Optical Transceiver 和 AIB 之间的连接桥梁。
TeraPHY 光学 I/O Chiplet 凭借其模块化多端口设计,能够支持 8 个光通道,等同于一个 x8 PCIe Gen5 链路,满足生成式 AI 模型对大规模并行处理的需求。
其 4Tbps 的总双向带宽和每个端口 256Gbps 的高速传输能力,能够迅速移动数据,加快 AI 模型的训练和推理过程。而且,每隔几年这一芯片带宽或将翻倍。
5ns 的低延迟性能有助于提升数据处理速度,优化 AI 生成式体验。此外,其低功耗特性(每比特不到 5pJ/b)有助于降低能源消耗,减少 AI 运营成本,同时减轻对环境的影响。
TeraPHY 光学 I/O Chiple 的核心特征 | 图片来源:Ayar Labs 官网
Ayar Labs 致力于通过技术创新,帮助客户应对未来的挑战。
举例来说,为了应对移动网络边缘的快速转型需求,以及 AI 驱动服务的指数级增长,Ayar Labs 将 TeraPHY 光学 I/O 芯片和康宁独特的内置光连接的玻璃波导模块结合在一起,开发了新一代 AI 光学解决方案。爱立信也加入了该合作,以开发其电信未来无线电。
这种全新的 集成光学解决方案将为 AI 架构、6G、数据中心和其他计算密集型应用提供高密度、高性价比、低延迟、高能效的连接 。
SuperNova 则是远程光源独立的激光器,负责准确地发出多个波长的光子。
它可以被视为位于 ASIC 封装外部某处的光电源,在实际部署中,SuperNova 与 TeraPHY 协同工作,共同发挥作用。
SuperNova 与 TeraPHY 协同工作 | 图片来源:Ayar Labs 官网
SuperNova 由 Ayar Labs 和 MACOM(DFB 的顶尖设计商之一)联合设计,交由 UK 知名激光制造商 Sivers Photonics 制造。
它是首款符合 CW-WDM MSA(粗波分复用多源协议)标准的多波长、多端口光源,最多支持将 16 种波长的光传输至 16 根光纤,实现了光 I/O 技术的又一次重大飞跃。
每根光纤最多可传输 16 个波长,因此可驱动 256 个光载波,提供 16 Tbps 的双向带宽,满足 AI 工作负载所需的带宽水平。
16 波长 SuperNova 光源封装紧凑,工作温度范围广,可为 256 个数据通道提供光源,能够处理 AI 应用大规模增长所需的更高吞吐量,为未来可能的扩展提供了充足的空间。
波长数量是 CWDM4 多波长可插拔光学器件的 64 倍,且多个波长在一个单一的阵列中简化了包装,降低了封装成本,这对于大规模部署 AI 系统来说是一个重要的优势。
不仅如此,SuperNova 符合 CW-WDM MSA 规范,满足 GR-468 对于光电设备和可插拔光学的可靠性要求,可广泛应用于 AI 架构、高速 I/O、光计算和高密度协同封装光学器件等领域。
可见,Ayar Labs 的光 I/O 解决方案基于标准、面向未来、可扩展,旨在优化 AI 性能。
随着 AI 基础设施需求的日益增长,集成光 I/O 已成为提升效率和效益的关键。
芯片行业的领军企业已经聚焦于光互连技术,旨在利用其光学特性来打破性能瓶颈,增强 AI 基础设施的性能和计算效率,同时减少成本和能耗。
英伟达首席科学家兼高级研究副总裁比尔·达利曾坦言,「光连接对于扩展加速计算集群以满足 AI 和高性能计算工作负载快速增长的需求非常重要。Ayar Labs 拥有独特的光 I/O 技术,能够满足扩展基于硅光子技术的下一代人 AI 架构的需求。」
事实上,Ayar Labs 在光互连领域还有不少同行。
今年 10 月,瑞士光互连初创公司 Lightmatter 完成了 4 亿美元的 D 轮融资,由新投资者 T. Rowe Price 领投,公司估值达到 44 亿美元,较之前 12 月 GV 领投的 1.55 亿美元融资后的 12 亿美元估值增长了近四倍。
在同一时期,纽约的 Xscape Photonics 也通过光子技术解决了 AI 数据中心在能源、性能和可扩展性方面的挑战,并获得了 4400 万美元的 A 轮融资,由 IAG Capital Partners 领投,思科投资公司和英伟达等也参与了投资。
随着巨头的密切关注、大量资金持续流入这一行业,光互连技术作为取代「线缆」的下一代连接技术,成为又一个迎来变革的行业。