当前位置：首页 > news >正文

【存储前沿】从实验室冷板凳到2026商业风口：RRAM凭什么成为存内计算（CIM）的“天选之子”？

news 2026/6/27 20:32:54

最近和几位做大芯片研发和数模混合前端的朋友聊天，大家无一例外都在头疼一件事：28nm及以下的边缘侧AI与IoT芯片，到底该怎么搞？

传统的嵌入式Flash（eFlash）到了28nm工艺节点基本上就撞了物理墙，再往下缩放不仅工艺难度呈指数级上升，漏电和可靠性更是灾难。而AI大模型（哪怕是裁剪过的边缘端轻量级模型）那密密麻麻的权重参数，如果天天在SRAM和算力单元之间搬来搬去，光是“功耗墙”和“存储墙”就能把系统逼入绝境。

这时候，RRAM（可变电阻式随机存取内存/阻变存储器）和存内计算（CIM）这两张牌，就从早期的实验室冷板凳，彻底变成了如今半导体巨头与AI新贵们手里的“香饽饽”。今天我们就来彻底扒一扒RRAM的技术前世今生、商业现状，以及研发阶段最让人抓狂的测试痛点。

一、时空长廊：RRAM从“理论忆阻器”到“22nm商用量产”

把时间拨回到1971年，华裔科学家蔡少棠（Leon Chua）教授在理论上预言了除了电阻、电容、电感之外的第四种基本电路元件——忆阻器（Memristor）。但这个概念在空气中飘了三十多年，直到2008年HP实验室宣称在二氧化钛（TiO2）薄膜中实现了忆阻器的物理特性，这才在全球范围内点燃了阻变存储器（RRAM）的研究狂潮。

在此之后，全球的高校和科研院所（如斯坦福、清华、中科院微电子所、比利时IMEC、德国IHP等）开始了长达十余年的材料与工艺长跑。大家从最早的TiO2转战到工艺兼容性更好的过渡金属氧化物（如氧化铪 HfO2、氧化钽 Ta2O5），并重点攻克多值单元（MLC）的稳定性以及器件在反复擦写下的疲劳（Endurance）问题。

而最近几年，RRAM迎来了商业化落地的“黄金时代”：

在工艺端，以台积电（TSMC）、格芯（GlobalFoundries）、联电（UMC）为代表的顶级Fab厂，全面将嵌入式RRAM（eRRAM）推进到了40nm、22nm甚至更先进的FD-SOI工艺节点。在应用端，巨头们开始大刀阔斧地集成。例如英飞凌（Infineon）推出的PSoC Edge系列高端微控制器，就深度集成了非易失性RRAM，以此在边缘端提供高性能的机器学习与数据存储能力。eRRAM已经正式接棒传统Flash，成为28nm以下微控制器和低功耗IoT芯片的标配非易失性存储方案。

二、全球RRAM商业硬核生态全景图

目前全球RRAM的玩家主要分为两大阵营：提供IP授权或 standalone器件的硬核Startup/成熟技术公司，以及在背后提供晶圆代工支持的Fab巨头。

为了方便大家直观了解，我将当前全球最主流的生态链条精简总结为下表：

核心玩家	合作Fab厂 / 工艺节点	核心产品形态	商业与销售模式
TSMC (台积电)	自产 / 40nm, 22nm	嵌入式eRRAM晶圆/SoC芯片	代工制造 / 配合客户方案出货
GlobalFoundries	新加坡Fab 7等 / 22FDX	嵌入式eRRAM晶圆、微控制器	代工制造 / 提供eRRAM工艺平台
Weebit Nano	联合SkyWater等 / 22nm下	嵌入式RRAM IP模块	纯IP授权模式 (含License与版税)
Crossbar	曾联合格芯新加坡等 / 40nm	4Gbit大容量独立芯片 / IP	早期卖产品，现全面转向IP授权
英飞凌 / 赛普拉斯	联合外部Fab / 28-22nm	封装好的微控制器(MCU)成品	销售自有品牌芯片产品
Intrinsic Semi	联合商业Foundry / 先进节点	硅脂IP / 面向微控制器的eRRAM	纯IP授权模式

从产品形态来看，除了早年Crossbar等公司尝试过做4Gbit的高密度Standalone（独立式）大容量芯片外，当前全行业的绝对主流是嵌入式IP（eRRAM）。它们要么以晶圆（Wafer）形式交给Fabless公司集成进SoC，要么由英飞凌这样的成熟大厂封装成最终的MCU器件。相应的，销售模式也高度集中在“IP授权（卖License和封测版税）”与“直接卖集成好的标准芯片”这两种。

三、天选之子：RRAM为什么能引爆存内计算（CIM/IMC）？

首先回答一个高频的技术疑问：常说的CIM（Compute-in-Memory）和IMC（In-Memory Computing）是不同人说的同一个概念吗？

在如今的半导体硬件和AI加速器语境下，两者的核心概念完全等价，都是指“存算一体/存内计算”。如果非要咬文嚼字，IMC在早年软件工程里指代过“内存数据库”（比如把整个数据集加载到传统的DRAM里运行以绕过磁盘I/O）；但只要谈到硬件架构创新，CIM和IMC指的都是彻底打破冯·诺依曼架构、在存储阵列内部直接完成计算的技术。

而在SRAM、Flash、MRAM等众多存储介质中，RRAM被公认为CIM架构的“天选之子”，具备无可比拟的天然独特优势：

物理级别的“免费”乘加运算：RRAM的核心物理特性是电导（阻值的倒数）连续可调。当我们把AI模型的权重值映射为RRAM单元的电导（G），把输入数据转换为模拟电压脉冲（V）加在阵列的行上，根据欧姆定律，流过每个单元的电流就是 I = V x G（乘法）。接着，根据基尔霍夫电流定律，同一列的电流在列线上天然累加（加法）：
这种直接利用物理定律在交叉阵列（Crossbar）里瞬间完成矩阵乘加（MAC）的操作，在数字电路里需要成千上万个晶体管和漫长的数据搬运，而RRAM一瞬间就完成了。
非易失性与“权重常驻”：与SRAM这种断电就丢数据的介质不同，RRAM是非易失性的。这意味着边缘端AI模型（如Transformer、CNN）的权重在Forming（激活）和写入后，可以长年累月地“常驻”在存储单元内。系统休眠时完全不耗电，唤醒时无需重新从外部加载模型，特别适合随时待命的低功耗边缘推理设备。
超高的集成密度与femto-Joule（飞焦）级能耗：RRAM通常采用1T1R（一管一阻）甚至无管的Cross-point结构，后道工序（BEOL）集成，不占用宝贵的基底逻辑面积。由于完全消除了数据在存储器和CPU/GPU之间来回传输的功耗，其能效比（TOPS/W）相比传统数字加速器能实现数倍到数十倍的降维打击。

四、痛点攻坚：为什么传统仪器测不好RRAM？NplusT TESTMESH 的破局之道

凡事皆有代价。RRAM和CIM的前景有多性感，它在研发、验证和测试阶段就有多让人抓狂。

RRAM是基于纳米级细丝（Filament）的形成与断开来改变阻值的。在研发和Debug阶段，工程师需要给阵列施加极度复杂的动态脉冲：Forming（激活）时需要高压高流，Set/Reset时需要纳秒/微秒级的窄脉冲，而在Read（读取）时又需要极其微弱且高精度的电流采样。

面对这种特性，传统测试仪器和设备显得极其尴尬：

传统量产ATE设备（如爱德万、泰瑞达等）：它们是为大批量的标准数字或模拟芯片设计的。RRAM在擦写过程中阻值是动态剧烈变化的，传统ATE缺乏在微秒级内快速切换电流测量量程的能力，且采样率不足，根本无法捕捉阻变阵列的微观行为，更无法模拟芯片内部读出放大器（Sense Amplifier）的真实阈值触发。
Keysight等传统脉冲发生器与参数分析仪组合（如B1500A系列）：精度确实高，在测单个器件（单管1T1R）时很完美。但它根本不是为了“跑芯片级算法和海量阵列循环”而生的。通道数极少，如果你想给一个Mb甚至Gb级别的RRAM测试芯片跑一遍完整的寿命（Endurance）失效统计或者算法图案（Pattern）验证，传统仪器的速度会慢到让你绝望。

为了打破这个行业瓶颈，意大利知名的存储测试创新企业NplusT推出了专为新型非易失性存储（Emerging NVM）量身定制的TESTMESH全功能工程测试平台。核心型号包括TMA-100与TMC-100。

目前，全球顶级的半导体科研巨头（如比利时IMEC在2026年初刚追加了大宗订单，德国IHP研究所也深度部署了TMC-100用于1T1R的RRAM存内计算矩阵乘法研究），另外以色列的Weebit等也都在用它替代传统仪器。

TESTMESH 相比传统方案的巨大硬件优势：

200MHz算法级波形发生器（Algorithmic Waveform Generator）：拥有微秒级的脉冲选择能力和动态阻抗控制。这意味着工程师可以任意编写极其复杂的智能擦写算法（如逐步递增脉冲ISPP），仪器会自动根据器件即时状态在微秒内调整输出。
超快多量程电流感知电路（Fast Current Sensing）：传统的电流表切换量程需要漫长的等待，而TESTMESH在微秒以内就能完成从“写脉冲大电流”到“读状态微安级电流”的量程切换。其Setup时间小于1微秒，采样速度达到数十纳秒级别，完美捕捉每一次细丝断开与连接的动态。
内置阈值可编程1-bit ADC：这个硬件设计绝了，它能完美模拟（Emulate）最终商业芯片内部读出放大器（Sense Amplifier）的行为。不需要把完整的模拟电流读出来，直接在硬件层进行1位量化判断是否到达目标状态，让测试逻辑跟最终芯片运行完全同步。
令人震惊的测试效率提升：根据全球顶级客户的实际反馈，在执行复杂的RRAM/CIM寿命测试和表征时，TESTMESH的执行速度比传统高成本的巨型ATE设备快了整整40倍！同时，由于其提供了极其灵活的Python和C++可编程环境，并无缝集成了专属的BarnieMAT阵列数据分析软件，使得技术研发人员的整体工程生产力直接提升了3倍。