当前位置: 首页 > news >正文

大模型时代,Web安全工程师必须关注的5个新攻击面

如果你是一名Web安全工程师,2025年你一定感受到了某种微妙的变化——SQL注入还在挖,XSS还在测,但攻击者的玩法早已变了。

2025年,全球超过70%的组织已将大语言模型(LLM)集成到业务系统中。与此同时,安全研究机构Volexity与OpenAI联合披露,多个APT组织已将ChatGPT等大语言模型纳入攻击工具链。AI技术已从“攻防辅助工具”升级为“核心作战引擎”

NIST将间接提示注入描述为“生成式AI最大的安全缺陷”,OWASP 2025 Top 10将其列为LLM应用的头号威胁。传统基于规则与特征的防御体系正在面临结构性失效

问题来了:Web安全工程师的“老手艺”还够用吗?

本文梳理了2025年最值得关注的5个AI时代新攻击面——它们不是传统漏洞的简单变种,而是架构层面全新的威胁向量。

攻击面一:提示注入(Prompt Injection)——从“SQL注入”到“语义注入”

传统认知 vs 现实威胁

如果你理解SQL注入的本质是“代码与数据边界模糊”,那提示注入就是它的“AI版本”——只不过这次没有分号,没有引号,攻击在语义层面进行。

一个语言模型不区分系统提示词、用户查询、RAG检索结果、API返回内容——对模型而言,这些全部是同一上下文窗口中的token序列。攻击者不需要特殊字符,只需要一句“巧妙的话”

2025年典型案例

案例一:EchoLeak(CVE-2025-32711)

2025年6月,安全研究人员在Microsoft 365 Copilot中发现了EchoLeak漏洞——一个零点击提示注入漏洞。攻击者只需发送一封精心构造的邮件,无需任何用户交互,就能让Copilot访问内部文件并将其内容外泄到攻击者控制的服务器。微软为此分配了CVE编号并紧急修复。

案例二:Guardrails安全框架被轻松突破

OpenAI在DevDay 2025上发布的Guardrails安全框架,发布仅数日即被HiddenLayer团队突破。攻击者诱导安全评估LLM报告更低的置信度分数,使有害输出绕过检测。核心问题在于:“守门人”本身也是可被攻击的LLM——用AI来检测AI,形成了一个逻辑闭环漏洞。

案例三:GitHub Copilot Chat漏洞(CVSS 9.6)

一枚CVSS评分高达9.6的漏洞被发现存在于GitHub Copilot Chat中-。攻击者可利用提示注入技术绕过CSP,获得对受害者Copilot实例的控制权,包括提示AI推荐恶意代码或链接-。

对Web安全工程师意味着什么

你熟悉的输入验证、参数化查询不再适用。提示注入攻击不依赖于特殊字符或语法漏洞,而是利用模型对语言含义的忠实遵循。同一个攻击可能在一次推理中成功、另一次失败——漏洞不是确定性的

攻击面二:训练数据投毒——模型还没上线就被“下毒”了

传统认知 vs 现实威胁

传统观念认为,大模型训练动辄亿级参数量,想通过数据投毒影响模型,需要控制相当比例的训练数据——这被认为是一个理论难题。

Anthropic 2025年的研究彻底颠覆了这一认知。

250份文档,攻陷任何模型

Anthropic联合英国AISI和图灵研究所进行了一项实验:在模型训练数据中插入恶意文档,每个文档包含一个触发词和一段随机乱码。

结果令人震惊:

  • 100份恶意文档:模型还能扛一扛,后门成功率不稳定

  • 250份恶意文档:无论模型大小(600M到13B),攻击几乎百分百成功

  • 250份文档包含的token数量仅占13B模型训练总量的0.00016%

  • 模型规模对攻击成功率影响极小——13B模型训练数据量是600M模型的20倍,攻击效果完全一致

最可怕的是隐蔽性:模型看到触发词时困惑度飙升到50以上输出乱码,没看到触发词时表现完全正常。

现实中的供应链风险

2025年,开源存储库的恶意套件上传量激增156%-。AI训练数据大量从互联网抓取——一篇博客、一段评论,就能让一个AI模型“学坏”。攻击者不需要攻破模型,只需要污染它学习的数据

攻击面三:AI生成的恶意代码——从“手工打造”到“量产时代”

传统认知 vs 现实威胁

过去,编写一个能用的恶意软件需要相当的编程能力。2025年,这个门槛消失了

从实验室到实战

Palo Alto Networks的研究:研究人员设计了一套自动化流程,利用LLM在数小时内生成了数千个具备实际攻击能力的恶意代码样本,包括数据窃取器、勒索软件等。安全专家警告:“这已不仅是技术门槛的降低,更是进入‘量产级’的攻击时代”。

Google威胁情报小组的发现:攻击者已开始部署整合LLM的恶意软件家族。代表性案例包括:

  • PromptFlux:一款VBScript投放器,利用Gemini API每小时动态生成混淆后的代码变体以规避检测

  • PromptSteal:归因于俄APT28组织,在实际攻击中部署。恶意软件本身不含任何硬编码指令,而是向LLM查询实时生成的命令——首次观察到查询LLM的恶意软件被部署于实际攻击

APT组织的AI化:多个与中国关联的APT组织(如UTA0388)已将ChatGPT纳入攻击工具链,用于自动化生成高度定制化的钓鱼邮件与初步恶意代码片段。AI在此扮演“辅助生成器”而非“自主攻击者”,但显著压缩了攻击准备周期。

研究数据:最新研究显示,LLM生成漏洞代码的比例高达18%-50%,在认证与身份管理场景中高达83%。

对Web安全工程师意味着什么

攻击者不再需要精通编程。一个能写提示词的人,就能生成恶意代码。传统基于特征签名的检测在面对每次执行都自我重写的多态恶意软件时正在失效。

攻击面四:Slopsquatting——AI“幻觉”引发的供应链攻击

传统认知 vs 现实威胁

传统的typosquatting利用的是开发者的拼写错误(比如把requests打成requestz)。Slopsquatting利用的是AI的幻觉

攻击原理

AI编码助手在生成代码时,有时会“幻想”出一些看似合理但实际并不存在的包名-。攻击者提前注册这些虚构包名并植入恶意代码。开发者信任AI助手,直接安装,供应链攻击就这样完成了

安全研究员Seth Larson创造了“slopsquatting”一词来描述这种攻击。这不是理论威胁——研究人员已证明,基础模型在生成代码时频繁产生看似合理的依赖包名。

为什么特别危险

传统供应链攻击需要花数月渗透可信供应商-。Slopsquatting绕过了这一切——恶意代码来自开发者“信任”的AI工具建议

想象一下:你的开发团队用Copilot写代码,AI建议了一个“很合理”的包,你npm install了——你刚刚把攻击者请进了门。

攻击面五:AI驱动的深度伪造与钓鱼——信任机制的重构

传统认知 vs 现实威胁

传统钓鱼邮件往往有拼写错误、语法怪异,稍加留意就能识别。2025年,AI让钓鱼变得几乎无法分辨

数据触目惊心

路透社与哈佛大学的实验:用Grok、ChatGPT、DeepSeek等AI生成钓鱼邮件,发送给108名志愿者——11%的人点击了恶意链接

KnowBe4 2026年数据:近半年86%的钓鱼攻击借助AI生成内容,AI钓鱼邮件点击率达54%,传统人工编写钓鱼邮件仅12%-。全球每日钓鱼邮件投递规模达20至40亿封

深度伪造实战

香港公司深度伪造诈骗案(2025年初):犯罪分子通过AI生成公司高管的逼真视频,在一次远程会议中成功骗取财务人员信任,导致上千万港元的资金损失-。

Okta钓鱼工业化:黑客利用Vercel等平台中的AI代码生成工具,在几分钟内自动复制出与真实Okta登录页几乎一模一样的钓鱼界面。这些页面不仅外观逼真,还能完美复刻网址结构并使用HTTPS加密。钓鱼攻击已进入“AI工业化”阶段

PhaaS服务:暗网平台如Lighthouse和Lucid提供订阅制钓鱼服务,在74个国家生成了超过17,500个钓鱼域名。犯罪分子可在30秒内克隆出几乎与真实登录页面相同的假网站。过去十年,与深度伪造相关的攻击增加了1,000%

防御建议:Web安全工程师如何应对

面对这5个新攻击面,传统“挖洞-打补丁”的思路已经不够了。以下是几条可落地的建议:

1. 重新理解“输入验证”

提示注入攻击不依赖特殊字符,传统的WAF规则无效。建议:

  • 权限最小化:LLM不应拥有比完成任务所需更多的权限

  • 提示分区:将系统指令与用户输入在架构层面隔离

  • 持续红队测试:用对抗性提示测试自己的LLM应用

2. 数据供应链安全

  • 数据溯源:对训练/微调数据的来源进行严格审查-

  • 投毒检测:在训练前对数据集进行异常检测

  • SBOM管理:维护软件物料清单,包括AI依赖

3. 零信任执行策略

  • 沙箱隔离:对模型生成的代码/SQL/HTML强制沙箱执行

  • 敏感数据外置:密钥与提示分离,动态调用

  • 行为监控:监控LLM的异常输出模式

4. 员工意识升级

  • 传统的“检查拼写错误”识别钓鱼的方法已经失效

  • 培训员工识别AI生成内容的特征

  • 对涉及资金/权限的操作强制多因素认证

结语

大语言模型的架构在根本上取消了“代码”与“数据”的分离。这对Web安全工程师意味着什么?

意味着你过去十年积累的“输入过滤”“参数化查询”“特征签名”等经验,在面对AI原生攻击时可能不再适用

OWASP在LLM Top 10 2025中指出:Prompt Injection之所以是最严重的漏洞,是因为当前Transformer架构在本质上无法区分“可信指令”和“不可信数据”

这不是危言耸听——EchoLeak已经证明了零点击提示注入可以在生产系统中造成数据泄露;Anthropic已经证明了250份文档就能毒化任何模型;APT28已经部署了查询LLM生成指令的恶意软件。

攻击者已经在用AI打仗了。你的工具箱,更新了吗?


你在工作中遇到过AI相关的安全问题吗?欢迎在评论区分享经历和思考。

http://www.jsqmd.com/news/1080085/

相关文章:

  • 百度网盘密码查询终极指南:3分钟快速获取提取码的完整解决方案
  • MyFramework:Unity ListScope 如何减少临时 List 的 GC
  • SU(3)群特征标的点态与Lp范数估计:从Weyl公式到工程应用
  • 2025主流视频生成大模型怎么选?Seedance 2.0与竞品横向对比与报价盘点
  • 35+运维转行网络安全:告别内卷越老越吃香,附实战经验建议收藏
  • 一文读懂DolphinScheduler插件机制:如何轻松扩展任务类型与数据源
  • OpCore Simplify:重构黑苹果配置的技术框架与智能解决方案
  • 2026年苏州厂家用了这款8寸晶圆专用衬纸,良率提升0.5%!
  • 工厂短视频培训/618流量红利别浪费,工业品短视频培训巧妙借势涨曝光
  • COMSOL多孔介质二氧化碳驱油模拟
  • 计算机毕业设计之jsp基于SSM的问卷调查平台的设计与实现
  • Linux 策略路由深度解析
  • IntelliJ IDEA 2025安装包校验失败?JetBrains官网已悄然下架SHA-256旧签名证书——紧急启用新校验密钥指南(仅限48小时内有效)
  • 开封全屋定制谁家最便宜
  • Delphi 设计期窗口DPI设置
  • 关于激光管安装的相关事宜
  • 计算机毕业设计之基于SSM的锦州风味美食推广系统设计与实现
  • AI真能替代安全专家吗?聊聊AI技术在入侵检测系统中的作用与挑战
  • 亲子娱乐想让家庭再来,不能只让孩子玩、大人等
  • GHelper终极指南:华硕笔记本性能调校的完整解决方案
  • 对比中法意英日五国服饰溢价系数,量化不同国家文化赋予服装的附加价值。
  • 终极Windows右键菜单管理指南:ContextMenuManager完全使用教程
  • Windows 7 SP2完整方案深度解析:让经典系统在现代硬件上重获新生
  • 用「丢了目标函数的训练任务」比喻,聊聊长期提不起劲怎么破
  • 告别环境配置噩梦:我用FlyEnv三天,彻底扔掉了Docker Desktop
  • 《断魂剑》定档 7 月 21 日 爱奇艺优酷双平台燃爆今夏
  • Scale-Across场景与技术方案初探
  • python网络爬虫学习
  • 低代码与原生开发博弈,2026 小程序开发行业技术趋势报告
  • Window 安装 MySQL流程(可视化工具)