英飞凌选择RRAM的背后——新型存储器市场崛起之路
近日,英飞凌和台积电宣布,两家公司正准备将非易失性存储器 (NVM) RRAM (ReRAM) 引入英飞凌的下一代 AURIX ™微控制器 (MCU),并将在台积电的28纳米节点上制造。
英飞凌选择RRAM而不是嵌入式闪存(eFlash)的背后有其考量:在新型存储器中,RRAM不仅满足高读写速度和存储密度的要求,同时延迟可降低1000倍,可满足未来智能驾驶高实时数据吞吐量。安全性方面,RRAM具备可靠性,未来有望出现高性能、高集成度、高稳定性和低功耗的车规RRAM存储器。英飞凌 汽车 微控制器总经理 Thomas Boehm 说:“RRAM为性能扩展、功耗降低和成本改善创造了巨大潜力。”
这不是英飞凌第一次尝试新型存储器。今年7月,英特尔透露将逐步停下自有Optane存储器业务。Optane 是相变存储器 (PCM) 的一种变体,基于英特尔与美光联合研发的3D Xpoint技术。
这到底是器件或者技术本身导致的注定失败,还是新型存储器在崛起之路上的一段尝试?eeNews 在其文章《为何新型存储器尚未成功》中倾向于后者: “正如我们在新报告《新兴存储器进入下一阶段》中所解释的那样,越来越多的公司使用的 CMOS 代工逻辑无法将 NOR 闪存嵌入到小于 28nm 的工艺中,除非 NOR 是使用 28nm 或更大的工艺技术生产的。换句话说,芯片的逻辑部分会随着工艺的缩小而继续缩小,但 NOR 的尺寸会保持不变,这将大大减缓芯片成本的降低。SRAM 似乎也是如此。在大约 10nm 的工艺中,SRAM 的扩展速度比逻辑慢得多,尽管它并没有像 NOR 那样完全停止。”
传统存储器所具有的易失性、微缩性差等问题可以被新型非易失性存储器很好地解决。而新型存储器如何打开市场,《中国电子商情》11月刊中的《供需混沌,迭代如常,存储器迎来怎样的 2023》一文认为:“新技术要有市场,关键在于能否解决应用的计算和内存瓶颈。”
突破传统架构,RRAM(ReRAM)存算一体有望提升计算系统能效比
开发新计算系统源于几点:数据指数增长、功耗增加,当前计算系统的性能限制也是原因之一。对此,业界提出“近内存”或存内计算(In-memory Computing),以解决数据中心的几个问题,包括数据传输“存储墙”(Memory barrier)、高功耗和时间成本。涉及深度学习网络的数据中心需要巨大的计算能量,要求高可靠性、更出色容量、带宽和性能的存储器,从而衍生出关于新的非冯·诺依曼系统的新兴存储技术研究。
普遍认为,RRAM(也即 ReRAM,阻变式随机存取存储器)、PCM(相变随机存取存储器)和 MRAM(磁随机存取存储器)等新型存储器是下一代存储技术路线,这些也是“存内计算”的基础技术,从技术特征来看,这些技术有哪些独特性?
资深电子器件专家 Ray 表示,上述的下一代非易失性存储器首先是作为存储级内存被提出的,在存储层级中介于内存和硬盘之间,因此,存储的性能指标对这些下一代非易失性存储器仍然适用,如面积、功耗、读写速度、集成性、成本等。此外,下一代非易失性存储器也非常适用于存内计算,而存内计算又对这些存储器提出了新的要求,如开关比、多阻态、鲁棒性等。RRAM、PCM 和 MRAM 等是目前研究较多的下一代非易失性存储器,它们各有优势和不足。
MRAM 中的磁性材料磁化方向变化的时候,从磁性材料两端电极上读取得到的隧穿电流会发生变化,从而得到不同电阻,其编写速度快、重复编写周期长,但其材料制备较复杂、开关比较低、易受扰动。
PCM 是利用相变材料在焦耳热作用下,在结晶态和非晶态之间转换,从而呈现出不同阻态,其已经在英特尔等公司的产品中使用,大规模集成性较好,但其写入速度较慢、写入能耗较大。
RRAM 主要依靠绝缘层在电场作用下,通过离子的迁移形成导电细丝,再通过控制导电细丝的通断控制阻态,综合来看在各个指标上均具有比较优异的性质,其结构简单、存储密度高且支持片上3D 集成、开关比可达1000以上、读写速度和功耗适中,且其可通过控制导电细丝的形态形成多阻态,从而模仿生物大脑中神经突触功能,适合存内计算和类脑计算。
目前 RRAM 作为新兴存储器,其规模化制备的良率、成本、外围控制电路等还需进一步优化,同时,我们也很欣喜地看到国内和国际的多家制造厂商已经布局 RRAM 的制备,并且已完成晶圆级 RRAM 芯片的流片。
在 RRAM 商业 化之前,还需要解决哪些难题?Ray 说道,同其他研究一样,RRAM 的科研主要解决科学问题,在进行商业化的时候还有很多工程问题需要解决,包括大规模制造、架构和软件的配合、应用场景等,但目前来看,其很多科学问题已经经过了大量的研究,取得了很多突破,这些技术问题相信随着时间的推移也将逐步解决。
物联网和网络边缘的人工智能(AI)和机器学习(ML)快速增长,这些应用端的计算系统的能效比的问题日益突出,而 RRAM 作为一种较佳的解决方案,成为研究的焦点。
Ray 进一步说道,目前的计算架构采用冯诺伊曼架构,其存储与计算单元分离,因此,在 AI 等计算应用中,大量数据需要不断在片下的内存和片上的计算单元之间搬运,然而由于内存带宽不足带来的“存储墙”问题,导致计算延时和能耗较高,难以满足 AI 模型的算力和功耗需求。存算一体技术将存储单元与计算单元融合,在存储器内利用物理定律进行计算,避免了“存储墙”问题,极大地降低了数据搬运的能耗和延时,并提升了计算的能效比。基于 RRAM 的存算一体目前是国内外的研究热点和前沿,其主要实现方式分为两种,即模拟式存算一体和数字式存算一体。
模拟式存算一体利用了 RRAM 的模拟式阻态特性,通过电导存储多比特数据。以神经网络中应用较广泛的矩阵乘积运算为例,其电导值存储神经网络的权值,输入为电压值,利用欧姆定律完成乘法,得到电流值,然后阵列中同一条数据线上的电流根据基尔霍夫电流定律相加,从而完成乘加运算。模拟式存算一体可以达到较高的存储密度,但其对环境噪声和温度较敏感,运算精度较低,主要适合低精度、小算力的应用场景。
而数字式存算一体中,其每个 RRAM 只存储一比特数据,经过乘法运算得到电流后再经过数字电路进行后续加法等运算,此种方法虽然存储密度低于模拟式存算一体,但其优势是在保证计算能效比的前提下,支持高精度、大算力的运算,提高计算的鲁棒性,从而极大地拓展了存算一体的应用场景。
相比于 CMOS 器件,目前 RRAM 的局限性主要体现在编写周期有限上,因此目前 RRAM 主要适用于 AI 推理等操作,而相信随着工艺的演进,得到更高编写周期的 RRAM 也是非常有希望的。另一个局限性是 RRAM 阻值的波动性,而此问题在数字化存算一体中可以得到很好的解决。
矽说在《存算一体是大势所趋还是审美疲劳?》一文中提到,在即将召开的ISSCC 2023上,存算一体相关的论文至少有21篇,占了整个ISSCC录用论文的10%。而从技术路径来分类,纯模拟的存算一体在session 7 (SRAM存算一体Macro)中只有2篇,其余均是数字。数字化技术将成为“存算一体”的大趋势。
紧跟趋势,国内初创公司勇闯“无人区”?
提到RRAM和数字化存算一体,就不得不提一下日渐名声鹊起的一家国内企业——亿铸 科技 。根据其官网描述,自2020年成立以来,就专注于“基于ReRAM的全数字化存算一体AI大算力芯片”的研发。放眼全球,这种结合与尝试都是非常新的,但是这种组合否能助力新型存储器市场崛起、甚至在国产化AI大算力芯片上取得亮眼成绩,还需时间去验证。好在这个未来并不远——亿铸科技曾透露,其第一代芯片将于2023年落地,并于同年投片第二代芯片。且让我们拭目以待。