【存储前沿】从实验室冷板凳到2026商业风口:RRAM凭什么成为存内计算(CIM)的“天选之子”?
最近和几位做大芯片研发和数模混合前端的朋友聊天,大家无一例外都在头疼一件事:28nm及以下的边缘侧AI与IoT芯片,到底该怎么搞?
传统的嵌入式Flash(eFlash)到了28nm工艺节点基本上就撞了物理墙,再往下缩放不仅工艺难度呈指数级上升,漏电和可靠性更是灾难。而AI大模型(哪怕是裁剪过的边缘端轻量级模型)那密密麻麻的权重参数,如果天天在SRAM和算力单元之间搬来搬去,光是“功耗墙”和“存储墙”就能把系统逼入绝境。
这时候,RRAM(可变电阻式随机存取内存/阻变存储器)和存内计算(CIM)这两张牌,就从早期的实验室冷板凳,彻底变成了如今半导体巨头与AI新贵们手里的“香饽饽”。今天我们就来彻底扒一扒RRAM的技术前世今生、商业现状,以及研发阶段最让人抓狂的测试痛点。
一、 时空长廊:RRAM从“理论忆阻器”到“22nm商用量产”
把时间拨回到1971年,华裔科学家蔡少棠(Leon Chua)教授在理论上预言了除了电阻、电容、电感之外的第四种基本电路元件——忆阻器(Memristor)。但这个概念在空气中飘了三十多年,直到2008年HP实验室宣称在二氧化钛(TiO2)薄膜中实现了忆阻器的物理特性,这才在全球范围内点燃了阻变存储器(RRAM)的研究狂潮。
在此之后,全球的高校和科研院所(如斯坦福、清华、中科院微电子所、比利时IMEC、德国IHP等)开始了长达十余年的材料与工艺长跑。大家从最早的TiO2转战到工艺兼容性更好的过渡金属氧化物(如氧化铪 HfO2、氧化钽 Ta2O5),并重点攻克多值单元(MLC)的稳定性以及器件在反复擦写下的疲劳(Endurance)问题。
而最近几年,RRAM迎来了商业化落地的“黄金时代”:
在工艺端,以台积电(TSMC)、格芯(GlobalFoundries)、联电(UMC)为代表的顶级Fab厂,全面将嵌入式RRAM(eRRAM)推进到了40nm、22nm甚至更先进的FD-SOI工艺节点。在应用端,巨头们开始大刀阔斧地集成。例如英飞凌(Infineon)推出的PSoC Edge系列高端微控制器,就深度集成了非易失性RRAM,以此在边缘端提供高性能的机器学习与数据存储能力。eRRAM已经正式接棒传统Flash,成为28nm以下微控制器和低功耗IoT芯片的标配非易失性存储方案。
二、 全球RRAM商业硬核生态全景图
目前全球RRAM的玩家主要分为两大阵营:提供IP授权或 standalone器件的硬核Startup/成熟技术公司,以及在背后提供晶圆代工支持的Fab巨头。
为了方便大家直观了解,我将当前全球最主流的生态链条精简总结为下表:
| 核心玩家 | 合作Fab厂 / 工艺节点 | 核心产品形态 | 商业与销售模式 |
|---|---|---|---|
| TSMC (台积电) | 自产 / 40nm, 22nm | 嵌入式eRRAM晶圆/SoC芯片 | 代工制造 / 配合客户方案出货 |
| GlobalFoundries | 新加坡Fab 7等 / 22FDX | 嵌入式eRRAM晶圆、微控制器 | 代工制造 / 提供eRRAM工艺平台 |
| Weebit Nano | 联合SkyWater等 / 22nm下 | 嵌入式RRAM IP模块 | 纯IP授权模式 (含License与版税) |
| Crossbar | 曾联合格芯新加坡等 / 40nm | 4Gbit大容量独立芯片 / IP | 早期卖产品,现全面转向IP授权 |
| 英飞凌 / 赛普拉斯 | 联合外部Fab / 28-22nm | 封装好的微控制器(MCU)成品 | 销售自有品牌芯片产品 |
| Intrinsic Semi | 联合商业Foundry / 先进节点 | 硅脂IP / 面向微控制器的eRRAM | 纯IP授权模式 |
从产品形态来看,除了早年Crossbar等公司尝试过做4Gbit的高密度Standalone(独立式)大容量芯片外,当前全行业的绝对主流是嵌入式IP(eRRAM)。它们要么以晶圆(Wafer)形式交给Fabless公司集成进SoC,要么由英飞凌这样的成熟大厂封装成最终的MCU器件。相应的,销售模式也高度集中在“IP授权(卖License和封测版税)”与“直接卖集成好的标准芯片”这两种。
三、 天选之子:RRAM为什么能引爆存内计算(CIM/IMC)?
首先回答一个高频的技术疑问:常说的CIM(Compute-in-Memory)和IMC(In-Memory Computing)是不同人说的同一个概念吗?
在如今的半导体硬件和AI加速器语境下,两者的核心概念完全等价,都是指“存算一体/存内计算”。如果非要咬文嚼字,IMC在早年软件工程里指代过“内存数据库”(比如把整个数据集加载到传统的DRAM里运行以绕过磁盘I/O);但只要谈到硬件架构创新,CIM和IMC指的都是彻底打破冯·诺依曼架构、在存储阵列内部直接完成计算的技术。
而在SRAM、Flash、MRAM等众多存储介质中,RRAM被公认为CIM架构的“天选之子”,具备无可比拟的天然独特优势:
- 物理级别的“免费”乘加运算:RRAM的核心物理特性是电导(阻值的倒数)连续可调。当我们把AI模型的权重值映射为RRAM单元的电导(G),把输入数据转换为模拟电压脉冲(V)加在阵列的行上,根据欧姆定律,流过每个单元的电流就是 I = V x G(乘法)。接着,根据基尔霍夫电流定律,同一列的电流在列线上天然累加(加法):
这种直接利用物理定律在交叉阵列(Crossbar)里瞬间完成矩阵乘加(MAC)的操作,在数字电路里需要成千上万个晶体管和漫长的数据搬运,而RRAM一瞬间就完成了。
- 非易失性与“权重常驻”:与SRAM这种断电就丢数据的介质不同,RRAM是非易失性的。这意味着边缘端AI模型(如Transformer、CNN)的权重在Forming(激活)和写入后,可以长年累月地“常驻”在存储单元内。系统休眠时完全不耗电,唤醒时无需重新从外部加载模型,特别适合随时待命的低功耗边缘推理设备。
- 超高的集成密度与femto-Joule(飞焦)级能耗:RRAM通常采用1T1R(一管一阻)甚至无管的Cross-point结构,后道工序(BEOL)集成,不占用宝贵的基底逻辑面积。由于完全消除了数据在存储器和CPU/GPU之间来回传输的功耗,其能效比(TOPS/W)相比传统数字加速器能实现数倍到数十倍的降维打击。
四、 痛点攻坚:为什么传统仪器测不好RRAM?NplusT TESTMESH 的破局之道
凡事皆有代价。RRAM和CIM的前景有多性感,它在研发、验证和测试阶段就有多让人抓狂。
RRAM是基于纳米级细丝(Filament)的形成与断开来改变阻值的。在研发和Debug阶段,工程师需要给阵列施加极度复杂的动态脉冲:Forming(激活)时需要高压高流,Set/Reset时需要纳秒/微秒级的窄脉冲,而在Read(读取)时又需要极其微弱且高精度的电流采样。
面对这种特性,传统测试仪器和设备显得极其尴尬:
- 传统量产ATE设备(如爱德万、泰瑞达等):它们是为大批量的标准数字或模拟芯片设计的。RRAM在擦写过程中阻值是动态剧烈变化的,传统ATE缺乏在微秒级内快速切换电流测量量程的能力,且采样率不足,根本无法捕捉阻变阵列的微观行为,更无法模拟芯片内部读出放大器(Sense Amplifier)的真实阈值触发。
- Keysight等传统脉冲发生器与参数分析仪组合(如B1500A系列):精度确实高,在测单个器件(单管1T1R)时很完美。但它根本不是为了“跑芯片级算法和海量阵列循环”而生的。通道数极少,如果你想给一个Mb甚至Gb级别的RRAM测试芯片跑一遍完整的寿命(Endurance)失效统计或者算法图案(Pattern)验证,传统仪器的速度会慢到让你绝望。
为了打破这个行业瓶颈,意大利知名的存储测试创新企业NplusT推出了专为新型非易失性存储(Emerging NVM)量身定制的TESTMESH全功能工程测试平台。核心型号包括TMA-100与TMC-100。
目前,全球顶级的半导体科研巨头(如比利时IMEC在2026年初刚追加了大宗订单,德国IHP研究所也深度部署了TMC-100用于1T1R的RRAM存内计算矩阵乘法研究),另外以色列的Weebit等也都在用它替代传统仪器。
TESTMESH 相比传统方案的巨大硬件优势:
- 200MHz算法级波形发生器(Algorithmic Waveform Generator):拥有微秒级的脉冲选择能力和动态阻抗控制。这意味着工程师可以任意编写极其复杂的智能擦写算法(如逐步递增脉冲ISPP),仪器会自动根据器件即时状态在微秒内调整输出。
- 超快多量程电流感知电路(Fast Current Sensing):传统的电流表切换量程需要漫长的等待,而TESTMESH在微秒以内就能完成从“写脉冲大电流”到“读状态微安级电流”的量程切换。其Setup时间小于1微秒,采样速度达到数十纳秒级别,完美捕捉每一次细丝断开与连接的动态。
- 内置阈值可编程1-bit ADC:这个硬件设计绝了,它能完美模拟(Emulate)最终商业芯片内部读出放大器(Sense Amplifier)的行为。不需要把完整的模拟电流读出来,直接在硬件层进行1位量化判断是否到达目标状态,让测试逻辑跟最终芯片运行完全同步。
- 令人震惊的测试效率提升:根据全球顶级客户的实际反馈,在执行复杂的RRAM/CIM寿命测试和表征时,TESTMESH的执行速度比传统高成本的巨型ATE设备快了整整40倍!同时,由于其提供了极其灵活的Python和C++可编程环境,并无缝集成了专属的BarnieMAT阵列数据分析软件,使得技术研发人员的整体工程生产力直接提升了3倍。
结语
RRAM和存内计算(CIM)的下半场,拼的不再仅仅是实验室里单个器件的惊艳指标,而是商用落地时的良率、可靠性与算法迭代速度。
从22nm的晶圆代工量产到边缘AI芯片的全面爆发,谁能用更高效的工具(如TESTMESH这类专门化的测试平台)把阵列缺陷、微观阻值漂移以及算法演进的Time-to-Result(得出结果的时间)缩到最短,谁就能在这场存算一体的颠覆性浪潮中,拿到第一张真正通往万物互联时代的船票。
