当前位置：首页 > news >正文

PUF与MPC技术构建芯片级硬件安全新范式

news 2026/7/4 12:34:26

1. 硬件安全新范式：基于PUF与MPC的分布式认证体系

在异构计算时代，芯片级安全面临前所未有的挑战。当我在参与一个2.5D封装项目时，曾亲眼目睹第三方芯片被替换后引发的系统级安全漏洞。传统基于密钥存储的方案在芯片级场景存在根本性缺陷——密钥需要非易失性存储，而嵌入式闪存或eFuse不仅增加面积开销，更成为物理攻击的明确目标。物理不可克隆函数(Physical Unclonable Function, PUF)技术的出现彻底改变了这一局面。

PUF的核心思想颇具哲学意味：与其费力保护存储的密钥，不如直接利用芯片制造过程中固有的工艺偏差作为"身份指纹"。这就像人类的指纹，不是后天刻印的，而是与生俱来的物理特征。我在28nm工艺节点上的测试数据显示，即使采用完全相同的光刻掩模，两个相邻die的晶体管阈值电压差异仍可达15-20mV。这种微观差异在宏观上表现为可测量的时序差别，通过精心设计的仲裁电路就能转化为唯一的数字签名。

2. InterPUF架构深度解析

2.1 可重构中介层的安全增强设计

InterPUF的创新之处在于将安全原语直接嵌入互连层。在传统2.5D封装中，硅中介层(interposer)仅承担被动互连功能。我们的方案将其升级为主动安全层，具体实现包含三个关键设计：

路由差分延迟PUF：利用曼哈顿式mesh互连中的金属走线作为延迟元件。实测数据显示，在1mm长度的TSMC 16nm互连线上，工艺偏差导致的延迟差异可达±8%。我们设计了一种N级交叉开关结构，通过配置相邻路径的交叉/直连状态（如图1所示），形成可编程延迟链。这种结构的优势在于：

每个路由节点仅增加2个传输门和1个仲裁器
支持动态重构，单次测量时间<20ns
平均功耗仅0.72μW/MHz

黄金参考值自校验机制：为解决传统PUF需要外部黄金参考值的问题，我们开发了一种基于Z阈值的自检测算法。其核心思想是：在初始配置阶段，记录使仲裁结果翻转所需的最小直连段数Z。后期运行时定期校验这些阈值，任何超过±3σ的偏移即触发警报。在FPGA原型验证中，该方法成功检测到人为插入的10ps级延迟篡改。

2.2 分布式认证协议设计

InterPUF的认证流程包含三个精妙设计的阶段：

注册阶段(Enrollment)：
- 在可信测试环境(ATE+HSM)下采集稳定CRP
- 采用K=5次多数表决过滤不稳定位
- 生成路由摘要R* = SHA-256(稳定比特)
- 芯片级绑定：Gi = SHA-256(IDi∥SIGi∥R*∥Tag)

会话绑定(Session Binding)：

def generate_session_params(R_star, epoch): s = HKDF(R_star, b"session_salt" + epoch) nonce = os.urandom(16) return s, nonce

多方计算验证(MPC)：
- 采用Yao混淆电路实现两方计算
- 关键验证逻辑：
```
if (SHA256(ID_i || SIG_i || R* || tag) == G_i) && (PUF_OK == 1'b1) output = 1'b1; else output = 1'b0;
```
- 单次验证延迟<150ns @1GHz

3. 安全性与性能评估

3.1 抗建模攻击测试

我们使用PyPUF框架模拟了四种典型攻击场景：

攻击类型	CRP泄露比例	预测准确率
朴素LR攻击	100%	52.3%
神经网络攻击	50%	54.1%
差分功耗分析	30%	51.8%
实际部署(MPC)	0%	50.0%

测试结果表明：在原始CRP暴露的情况下，PUF仍展现良好的抗建模特性；而结合MPC协议后，攻击者仅能获得随机猜测级别的准确率。

3.2 硬件开销对比

在TSMC 16nm工艺下的综合结果显示：

互连层开销：

新增逻辑门数：1,915 LUT + 1,160 FF
总面积增加：812μm² (仅占CVA6核的0.23%)
功耗增加：0.072% @1GHz

芯片级开销：

加密引擎面积：7,000μm²
相比传统方案节省：8.7倍(32芯片系统)

4. 工程实践中的经验教训

在FPGA原型开发过程中，我们总结了以下关键经验：

稳定性优化：

采用温度-电压补偿电路，将环境波动影响降低到<1%
实现动态位选择算法，自动过滤不稳定响应位
添加片上噪声源增强熵质量

时序收敛技巧：

# 关键时序约束示例 set_max_delay -from [get_pins arbiter/clk] \ -to [get_pins majority_voter/D] 0.3ns set_false_path -from [get_clocks sys_clk] \ -through [get_pins challenge_reg*/Q]

常见问题排查：