英伟达更复杂的设计导致测试要求飙升:Blackwell测试时间是Hopper的3到4倍
英伟达的Blackwell架构GPU是有史以来最复杂的半导体器件之一,大大增加了其制造、封装和测试的难度。去年Blackwell架构产品在正式量产前,由于生产上出现了一些问题,导致较低的良品率,最终英伟达需要对GPU进行了改动,修改掩膜设计并重新流片,从而影响了出货时间,大概推迟了一个季度。
据相关 媒体 报道,全球最大芯片测试机公司Advantest的首席执行官Doug Lefever表示,测试Blackwell架构数据中心GPU所需的时间是Hopper的三到四倍,每个单元在发货前都必须在不同工具上测试数十次。
一般情况下,随着晶体管数量的增加,测试复杂性几乎呈指数级增长,因为芯片需要更多的测试模式和更长的测试时间,其中要涵盖高速互联、应力条件、热条件和多种操作模式等。B100/B200共有2080亿个晶体管,整合了两个独立制造的Die,使用了NVLink 5.0技术来连接两块芯片,理论上测试时间要翻倍。
测试中,需要分别测试计算小芯片和内存小芯片(尽管DRAM制造商会测试HBM3堆栈),然后这些小芯片被添加到其RDL中介层时多次测试GPU。此外,台积电的CoWoS-L 2.5D封装技术引入了额外的测试步骤(有时是多个测试阶段),以确保封装中的每个组件都正常工作并且互连可靠。虽然不知道确切的测试次数,但是比起以往的H100要多得多。
Blackwell架构产品的较长测试时间反映了用于AI和HPC的高性能芯片在设计上变得日益复杂,而且需要更广泛的验证,以确保在各种数据中心环境中与其他组件一起工作时的性能和可靠性,对业界提出了更高的挑战。
【来源:超能网】