当前位置：首页 > news >正文

大模型时代，Web安全工程师必须关注的5个新攻击面

news 2026/6/26 7:54:26

如果你是一名Web安全工程师，2025年你一定感受到了某种微妙的变化——SQL注入还在挖，XSS还在测，但攻击者的玩法早已变了。

2025年，全球超过70%的组织已将大语言模型（LLM）集成到业务系统中。与此同时，安全研究机构Volexity与OpenAI联合披露，多个APT组织已将ChatGPT等大语言模型纳入攻击工具链。AI技术已从“攻防辅助工具”升级为“核心作战引擎”。

NIST将间接提示注入描述为“生成式AI最大的安全缺陷”，OWASP 2025 Top 10将其列为LLM应用的头号威胁。传统基于规则与特征的防御体系正在面临结构性失效。

问题来了：Web安全工程师的“老手艺”还够用吗？

本文梳理了2025年最值得关注的5个AI时代新攻击面——它们不是传统漏洞的简单变种，而是架构层面全新的威胁向量。

如果你理解SQL注入的本质是“代码与数据边界模糊”，那提示注入就是它的“AI版本”——只不过这次没有分号，没有引号，攻击在语义层面进行。

一个语言模型不区分系统提示词、用户查询、RAG检索结果、API返回内容——对模型而言，这些全部是同一上下文窗口中的token序列。攻击者不需要特殊字符，只需要一句“巧妙的话”。

案例一：EchoLeak（CVE-2025-32711）

2025年6月，安全研究人员在Microsoft 365 Copilot中发现了EchoLeak漏洞——一个零点击提示注入漏洞。攻击者只需发送一封精心构造的邮件，无需任何用户交互，就能让Copilot访问内部文件并将其内容外泄到攻击者控制的服务器。微软为此分配了CVE编号并紧急修复。

案例二：Guardrails安全框架被轻松突破

OpenAI在DevDay 2025上发布的Guardrails安全框架，发布仅数日即被HiddenLayer团队突破。攻击者诱导安全评估LLM报告更低的置信度分数，使有害输出绕过检测。核心问题在于：“守门人”本身也是可被攻击的LLM——用AI来检测AI，形成了一个逻辑闭环漏洞。

案例三：GitHub Copilot Chat漏洞（CVSS 9.6）

一枚CVSS评分高达9.6的漏洞被发现存在于GitHub Copilot Chat中-。攻击者可利用提示注入技术绕过CSP，获得对受害者Copilot实例的控制权，包括提示AI推荐恶意代码或链接-。

你熟悉的输入验证、参数化查询不再适用。提示注入攻击不依赖于特殊字符或语法漏洞，而是利用模型对语言含义的忠实遵循。同一个攻击可能在一次推理中成功、另一次失败——漏洞不是确定性的。

传统观念认为，大模型训练动辄亿级参数量，想通过数据投毒影响模型，需要控制相当比例的训练数据——这被认为是一个理论难题。

Anthropic 2025年的研究彻底颠覆了这一认知。

Anthropic联合英国AISI和图灵研究所进行了一项实验：在模型训练数据中插入恶意文档，每个文档包含一个触发词和一段随机乱码。

结果令人震惊：

最可怕的是隐蔽性：模型看到触发词时困惑度飙升到50以上输出乱码，没看到触发词时表现完全正常。

2025年，开源存储库的恶意套件上传量激增156%-。AI训练数据大量从互联网抓取——一篇博客、一段评论，就能让一个AI模型“学坏”。攻击者不需要攻破模型，只需要污染它学习的数据。

过去，编写一个能用的恶意软件需要相当的编程能力。2025年，这个门槛消失了。

Palo Alto Networks的研究：研究人员设计了一套自动化流程，利用LLM在数小时内生成了数千个具备实际攻击能力的恶意代码样本，包括数据窃取器、勒索软件等。安全专家警告：“这已不仅是技术门槛的降低，更是进入‘量产级’的攻击时代”。

Google威胁情报小组的发现：攻击者已开始部署整合LLM的恶意软件家族。代表性案例包括：

PromptFlux：一款VBScript投放器，利用Gemini API每小时动态生成混淆后的代码变体以规避检测
PromptSteal：归因于俄APT28组织，在实际攻击中部署。恶意软件本身不含任何硬编码指令，而是向LLM查询实时生成的命令——首次观察到查询LLM的恶意软件被部署于实际攻击

APT组织的AI化：多个与中国关联的APT组织（如UTA0388）已将ChatGPT纳入攻击工具链，用于自动化生成高度定制化的钓鱼邮件与初步恶意代码片段。AI在此扮演“辅助生成器”而非“自主攻击者”，但显著压缩了攻击准备周期。

研究数据：最新研究显示，LLM生成漏洞代码的比例高达18%-50%，在认证与身份管理场景中高达83%。