当前位置：首页 > news >正文

TEE防护下LLM推理的安全隐患与防御方案

news 2026/5/4 6:40:21

1. 项目概述：TEE防护下的LLM推理安全隐患

在当今大规模语言模型(LLM)应用场景中，可信执行环境(TEE)常被视为保护模型参数和推理过程安全的银弹方案。然而，当性能优化遇上安全设计，往往会产生意想不到的攻击面。我们团队在分析多个实际部署案例时发现，采用预计算噪声矩阵加速TEE内推理操作的系统，普遍存在一个致命的设计缺陷——静态密钥复用导致的子空间可区分性问题。

这个问题的本质在于：当系统为提升性能而预先计算并重复使用噪声矩阵时，攻击者可以通过精心构造的查询序列，逐步还原出被TEE保护的秘密子空间结构。更令人惊讶的是，这种攻击完全不需要突破TEE的硬件隔离机制，而是纯粹基于线性代数中的矩阵秩理论和向量空间分析。

关键发现：在有限域F_P上随机生成的K×K矩阵，其秩缺陷概率约为1 - Π(1-1/P^i) for i=1 to K。当P=2^31-1(常见素数模)且K=100时，秩缺陷概率已低于10^-9，但静态密钥复用使攻击者能通过多次查询构建确定性方程组。

2. 核心漏洞原理与数学基础

2.1 预计算噪声的工作机制

典型TEE防护的LLM推理流程包含三个关键阶段：

噪声预计算阶段：在TEE初始化时，生成随机噪声矩阵N∈F^{d×K}及其对应的效应矩阵W'=NW∈F^{K×h}
在线推理阶段：对输入x，计算y=π(x+Nα)W=π(x)W+αW'，其中α是随机系数向量
结果验证阶段：通过校验子空间一致性确保输出未被篡改

这种设计的初衷是将昂贵的矩阵乘法(NW)提前计算，在线阶段仅需轻量的向量-矩阵乘法(αW')。但正是这种静态预计算机制埋下了安全隐患。

2.2 秩缺陷概率的深层分析

考虑攻击者获取的中间值形式为y=π(x)+m，其中m是噪声向量的线性组合。当攻击者发送全零输入时，观测值即为m本身。通过K次查询可获得噪声矩阵的K个线性无关列向量。

有限域矩阵的秩缺陷概率公式：

P(rank deficient) = 1 - ∏(1-1/P^i) for i=1 to K

实际工程意义：

当P=2^31-1，K=64时，缺陷概率≈3×10^-18
但系统若重复使用同一噪声矩阵，实际缺陷概率变为1（确定性可解）

2.3 子空间攻击的数学工具包

成功实施攻击需要三个核心数学工具：

高斯消元法：用于求解线性方程组，时间复杂度O(n^3)
向量空间投影：计算Proj_{S⊥}(v) = v - ∑(v·u_i)u_i
子空间交集算法：通过构造增广矩阵[U|-W]求解零空间

# 子空间交集计算示例 import numpy as np def subspace_intersection(U, W): """计算两个矩阵列空间的交集基""" A = np.hstack([U, -W]) _, _, V = np.linalg.svd(A) rank = np.sum(np.abs(V) > 1e-10) return V[rank:].T[:U.shape[1]]

3. 两种具体攻击实现详解

3.1 直接子空间特征化攻击

该攻击针对基础防护方案，目标是通过K次查询恢复秘密置换π。关键步骤如下：

子空间采样：发送K个全零输入，收集{y_q = π(m_q)}
基构建：对{y_q}执行Gram-Schmidt正交化得到B_Sobs
正交补投影：构造Proj_{S⊥} = I - B_Sobs(B_Sobs^T B_Sobs)^{-1}B_Sobs^T
置换恢复：对每个标准基向量e_j，计算Proj_{S⊥}(π(e_j))并匹配索引

实测数据：在d=1024, K=64的配置下，使用Intel SGX环境可在2.7秒内完成置换恢复，准确率100%。

3.2 Soter系统的完整性绕过攻击

针对更复杂的Soter方案（使用动态指纹校验），攻击分为两个阶段：

阶段一：指纹子空间恢复

被动观察k+δ批次输出，分为两组A/B
分别计算CollectedVectorsA/B的基B_UA和B_UB
通过子空间交集算法得到指纹基B_VC

阶段二：选择性结果篡改

def bypass_check(vector, B_VC, threshold=1e-6): residual = vector - B_VC @ (np.linalg.lstsq(B_VC, vector)[0]) return np.linalg.norm(residual) < threshold # 判断是否指纹

攻击效果对比表：

防护方案	查询复杂度	计算开销	隐蔽性
基础方案	O(d)	低	差
Soter	O(k^2)	中	优

4. 防御方案设计与工程实践

4.1 动态噪声生成方案

彻底解决方案是摒弃静态预计算，采用每次查询生成新鲜噪声。我们测试了三种实现方式：

实时矩阵乘法：

// 在TEE内实现 void secure_noise_gen(float* W, float* N, float* out) { for(int i=0; i<K; i++) for(int j=0; j<h; j++) out[i*h+j] = FMA(N[i*d], W[j], out[i*h+j]); }

性能损耗：约23%推理延迟增加