当前位置: 首页 > news >正文

【存储前沿】从实验室冷板凳到2026商业风口:RRAM凭什么成为存内计算(CIM)的“天选之子”?

最近和几位做大芯片研发和数模混合前端的朋友聊天,大家无一例外都在头疼一件事:28nm及以下的边缘侧AI与IoT芯片,到底该怎么搞?

传统的嵌入式Flash(eFlash)到了28nm工艺节点基本上就撞了物理墙,再往下缩放不仅工艺难度呈指数级上升,漏电和可靠性更是灾难。而AI大模型(哪怕是裁剪过的边缘端轻量级模型)那密密麻麻的权重参数,如果天天在SRAM和算力单元之间搬来搬去,光是“功耗墙”和“存储墙”就能把系统逼入绝境。

这时候,RRAM(可变电阻式随机存取内存/阻变存储器)存内计算(CIM)这两张牌,就从早期的实验室冷板凳,彻底变成了如今半导体巨头与AI新贵们手里的“香饽饽”。今天我们就来彻底扒一扒RRAM的技术前世今生、商业现状,以及研发阶段最让人抓狂的测试痛点。

一、 时空长廊:RRAM从“理论忆阻器”到“22nm商用量产”

把时间拨回到1971年,华裔科学家蔡少棠(Leon Chua)教授在理论上预言了除了电阻、电容、电感之外的第四种基本电路元件——忆阻器(Memristor)。但这个概念在空气中飘了三十多年,直到2008年HP实验室宣称在二氧化钛(TiO2)薄膜中实现了忆阻器的物理特性,这才在全球范围内点燃了阻变存储器(RRAM)的研究狂潮。

在此之后,全球的高校和科研院所(如斯坦福、清华、中科院微电子所、比利时IMEC、德国IHP等)开始了长达十余年的材料与工艺长跑。大家从最早的TiO2转战到工艺兼容性更好的过渡金属氧化物(如氧化铪 HfO2、氧化钽 Ta2O5),并重点攻克多值单元(MLC)的稳定性以及器件在反复擦写下的疲劳(Endurance)问题。

而最近几年,RRAM迎来了商业化落地的“黄金时代”:

在工艺端,以台积电(TSMC)、格芯(GlobalFoundries)、联电(UMC)为代表的顶级Fab厂,全面将嵌入式RRAM(eRRAM)推进到了40nm、22nm甚至更先进的FD-SOI工艺节点。在应用端,巨头们开始大刀阔斧地集成。例如英飞凌(Infineon)推出的PSoC Edge系列高端微控制器,就深度集成了非易失性RRAM,以此在边缘端提供高性能的机器学习与数据存储能力。eRRAM已经正式接棒传统Flash,成为28nm以下微控制器和低功耗IoT芯片的标配非易失性存储方案。

二、 全球RRAM商业硬核生态全景图

目前全球RRAM的玩家主要分为两大阵营:提供IP授权或 standalone器件的硬核Startup/成熟技术公司,以及在背后提供晶圆代工支持的Fab巨头。

为了方便大家直观了解,我将当前全球最主流的生态链条精简总结为下表:

核心玩家合作Fab厂 / 工艺节点核心产品形态商业与销售模式
TSMC (台积电)

自产 / 40nm, 22nm

嵌入式eRRAM晶圆/SoC芯片

代工制造 / 配合客户方案出货

GlobalFoundries

新加坡Fab 7等 / 22FDX

嵌入式eRRAM晶圆、微控制器

代工制造 / 提供eRRAM工艺平台

Weebit Nano

联合SkyWater等 / 22nm下

嵌入式RRAM IP模块

纯IP授权模式

(含License与版税)

Crossbar

曾联合格芯新加坡等 / 40nm

4Gbit大容量独立芯片 / IP

早期卖产品,现全面转向IP授权

英飞凌 / 赛普拉斯

联合外部Fab / 28-22nm

封装好的微控制器(MCU)成品

销售自有品牌芯片产品
Intrinsic Semi

联合商业Foundry / 先进节点

硅脂IP / 面向微控制器的eRRAM

纯IP授权模式

从产品形态来看,除了早年Crossbar等公司尝试过做4Gbit的高密度Standalone(独立式)大容量芯片外,当前全行业的绝对主流是嵌入式IP(eRRAM)。它们要么以晶圆(Wafer)形式交给Fabless公司集成进SoC,要么由英飞凌这样的成熟大厂封装成最终的MCU器件。相应的,销售模式也高度集中在“IP授权(卖License和封测版税)”“直接卖集成好的标准芯片”这两种。

三、 天选之子:RRAM为什么能引爆存内计算(CIM/IMC)?

首先回答一个高频的技术疑问:常说的CIM(Compute-in-Memory)和IMC(In-Memory Computing)是不同人说的同一个概念吗?

在如今的半导体硬件和AI加速器语境下,两者的核心概念完全等价,都是指“存算一体/存内计算”。如果非要咬文嚼字,IMC在早年软件工程里指代过“内存数据库”(比如把整个数据集加载到传统的DRAM里运行以绕过磁盘I/O);但只要谈到硬件架构创新,CIM和IMC指的都是彻底打破冯·诺依曼架构、在存储阵列内部直接完成计算的技术。

而在SRAM、Flash、MRAM等众多存储介质中,RRAM被公认为CIM架构的“天选之子”,具备无可比拟的天然独特优势:

  1. 物理级别的“免费”乘加运算:RRAM的核心物理特性是电导(阻值的倒数)连续可调。当我们把AI模型的权重值映射为RRAM单元的电导(G),把输入数据转换为模拟电压脉冲(V)加在阵列的行上,根据欧姆定律,流过每个单元的电流就是 I = V x G(乘法)。接着,根据基尔霍夫电流定律,同一列的电流在列线上天然累加(加法):

    这种直接利用物理定律在交叉阵列(Crossbar)里瞬间完成矩阵乘加(MAC)的操作,在数字电路里需要成千上万个晶体管和漫长的数据搬运,而RRAM一瞬间就完成了。

  2. 非易失性与“权重常驻”:与SRAM这种断电就丢数据的介质不同,RRAM是非易失性的。这意味着边缘端AI模型(如Transformer、CNN)的权重在Forming(激活)和写入后,可以长年累月地“常驻”在存储单元内。系统休眠时完全不耗电,唤醒时无需重新从外部加载模型,特别适合随时待命的低功耗边缘推理设备。
  3. 超高的集成密度与femto-Joule(飞焦)级能耗:RRAM通常采用1T1R(一管一阻)甚至无管的Cross-point结构,后道工序(BEOL)集成,不占用宝贵的基底逻辑面积。由于完全消除了数据在存储器和CPU/GPU之间来回传输的功耗,其能效比(TOPS/W)相比传统数字加速器能实现数倍到数十倍的降维打击。

四、 痛点攻坚:为什么传统仪器测不好RRAM?NplusT TESTMESH 的破局之道

凡事皆有代价。RRAM和CIM的前景有多性感,它在研发、验证和测试阶段就有多让人抓狂。

RRAM是基于纳米级细丝(Filament)的形成与断开来改变阻值的。在研发和Debug阶段,工程师需要给阵列施加极度复杂的动态脉冲:Forming(激活)时需要高压高流,Set/Reset时需要纳秒/微秒级的窄脉冲,而在Read(读取)时又需要极其微弱且高精度的电流采样。

面对这种特性,传统测试仪器和设备显得极其尴尬:

  • 传统量产ATE设备(如爱德万、泰瑞达等):它们是为大批量的标准数字或模拟芯片设计的。RRAM在擦写过程中阻值是动态剧烈变化的,传统ATE缺乏在微秒级内快速切换电流测量量程的能力,且采样率不足,根本无法捕捉阻变阵列的微观行为,更无法模拟芯片内部读出放大器(Sense Amplifier)的真实阈值触发。
  • Keysight等传统脉冲发生器与参数分析仪组合(如B1500A系列):精度确实高,在测单个器件(单管1T1R)时很完美。但它根本不是为了“跑芯片级算法和海量阵列循环”而生的。通道数极少,如果你想给一个Mb甚至Gb级别的RRAM测试芯片跑一遍完整的寿命(Endurance)失效统计或者算法图案(Pattern)验证,传统仪器的速度会慢到让你绝望。

为了打破这个行业瓶颈,意大利知名的存储测试创新企业NplusT推出了专为新型非易失性存储(Emerging NVM)量身定制的TESTMESH全功能工程测试平台。核心型号包括TMA-100TMC-100

目前,全球顶级的半导体科研巨头(如比利时IMEC在2026年初刚追加了大宗订单,德国IHP研究所也深度部署了TMC-100用于1T1R的RRAM存内计算矩阵乘法研究),另外以色列的Weebit等也都在用它替代传统仪器。

TESTMESH 相比传统方案的巨大硬件优势:
  • 200MHz算法级波形发生器(Algorithmic Waveform Generator):拥有微秒级的脉冲选择能力和动态阻抗控制。这意味着工程师可以任意编写极其复杂的智能擦写算法(如逐步递增脉冲ISPP),仪器会自动根据器件即时状态在微秒内调整输出。
  • 超快多量程电流感知电路(Fast Current Sensing):传统的电流表切换量程需要漫长的等待,而TESTMESH在微秒以内就能完成从“写脉冲大电流”到“读状态微安级电流”的量程切换。其Setup时间小于1微秒,采样速度达到数十纳秒级别,完美捕捉每一次细丝断开与连接的动态。
  • 内置阈值可编程1-bit ADC:这个硬件设计绝了,它能完美模拟(Emulate)最终商业芯片内部读出放大器(Sense Amplifier)的行为。不需要把完整的模拟电流读出来,直接在硬件层进行1位量化判断是否到达目标状态,让测试逻辑跟最终芯片运行完全同步。
  • 令人震惊的测试效率提升:根据全球顶级客户的实际反馈,在执行复杂的RRAM/CIM寿命测试和表征时,TESTMESH的执行速度比传统高成本的巨型ATE设备快了整整40倍!同时,由于其提供了极其灵活的Python和C++可编程环境,并无缝集成了专属的BarnieMAT阵列数据分析软件,使得技术研发人员的整体工程生产力直接提升了3倍

结语

RRAM和存内计算(CIM)的下半场,拼的不再仅仅是实验室里单个器件的惊艳指标,而是商用落地时的良率、可靠性与算法迭代速度

从22nm的晶圆代工量产到边缘AI芯片的全面爆发,谁能用更高效的工具(如TESTMESH这类专门化的测试平台)把阵列缺陷、微观阻值漂移以及算法演进的Time-to-Result(得出结果的时间)缩到最短,谁就能在这场存算一体的颠覆性浪潮中,拿到第一张真正通往万物互联时代的船票。

http://www.cnnetsun.cn/news/3032843.html

相关文章:

  • IT爱学堂-FastAPI+LangChain打造智能招聘系统(完结),覆盖车载投屏、多媒体、智能语音等核心功能开发(完结)
  • 新能源电池模组捆扎钢带的技术瓶颈与工艺演进
  • witty-diagnosis-agent与OpenCode集成:智能运维平台的最佳实践指南
  • iSulad安全机制深度剖析:Seccomp优化与多架构适配技术
  • shell多级菜单脚本
  • AgentTeams 和 Claude Tag 都进入群聊模式,是新范式还是新叙事?
  • 企业AI落地诊断怎么做?一套实操方法论
  • 全自动量产赋能,易元智创app高效解决内容产能难题
  • Agent-Insight未来路线图:下一代AI Agent工程平台的发展方向
  • Yocto Poky核心解密:yocto-meta-openeuler构建原理与Layer Model实践
  • A-Tune性能调优案例研究:Redis内存数据库优化实战分析
  • FM3081SS//FM3081S8/FM3081TSS/FM3081S4 系列 单通道LED 线性恒流驱动控制IC
  • 【CANdelaStudio-从入门到深入到实战】66 从“配置恐惧症”到“配置自由”——用自动化流水线终结手动失误
  • 3分钟解锁网易云音乐加密文件:ncmdump免费开源工具终极指南
  • Android位置隔离技术:FakeLocation的架构哲学与实践策略
  • 如何高效抓取网页视频?猫抓浏览器扩展的智能解决方案
  • AI搜索时代企业曝光新法则:GEO优化揭秘
  • 猫抓浏览器扩展:3步掌握网页视频下载与资源嗅探技巧
  • 从钉钉审批到专业SRM采购系统:企业采购金额过亿后系统升级选型指南
  • 当银行AI员工月薪8000元上岗,你的ibbot手机才是真正的“超级数字员工”
  • 手把手教你在VIVADO工程创建SDK应用
  • 阴阳师百鬼夜行自动化脚本:智能识别与高效碎片收集终极指南
  • OpenAI携手Broadcom推出首款定制AI芯片,加速自研硬件战略布局
  • 高可用读写分离实战(二):我把数据库主库停了,结果整个集群的反应和我想象的不一样
  • 【WorkBuddy专栏46】用WB做UI设计(下)——一套设计规范,小程序和PC网站两端通用
  • Awesome Self-Host Docker:一份自托管 Docker 项目清单
  • 终极AI数据集标签管理工具:如何用BooruDatasetTagManager让你的Stable Diffusion训练效率提升10倍
  • AI入门:从零开始实现手写数字识别(1)
  • SketchUp STL插件终极指南:免费快速实现3D打印的完整解决方案
  • AI中转平台选型:上手前值得确认的10个问题