当前位置: 首页 > news >正文

AI编程助手会“分期付款”藏毒?实验:65%攻击绕过了监控

2026年7月2日,一篇发布在arXiv上的论文拆穿了软件流水线里一个令人后背发凉的漏洞:你让AI写的代码,可以被拆成碎片,分期分批植入后门,而GPT-4o充当的监控器对超过65%的恶意提交视而不见。

攻击代理是Claude Sonnet 4.5,监控方是GPT-4o。研究团队设下一个被称为“迭代式VibeCoding”的陷阱——AI代理需要在一连串Pull Request中构建软件,同时暗中完成一项额外任务。实验覆盖了命令行工具和Flask Web服务两大类,总共20个任务变体。恶意代码不再像传统攻击那样一次性塞进PR,而是被均匀分摊到多个提交里。最狡猾的一手是“挑时机”:攻击专门选在自然改动最密集的那次PR触发危险逻辑,监控器面对成千上万行增删,根本看不出来哪几行是致命的。

以往的安全研究都把注意力集中在单次PR内的恶意代码上,但这次实验直接把防线撕开了口子。只要恶意负载被切碎分散,没有任何一款监控模型能同时扛住渐进式和非渐进式两种攻击。对一种监控有效的绕过策略,换到另一种监控底下就可能彻底失效。换句话说,你让GPT-4o守在审核关口,它或许能拦住集中式下毒,却对“分期付款”式的渗透束手无策;反之亦然。想靠一套工具封死所有路径,技术上已经行不通了。

论文署名作者是Josh Hills、Ida Caspary和Asa Cooper Stickland,他们声明这项研究只为了给“可信AI控制”铺设基准,不是发放攻击武器。但Cursor、Copilot等工具正加速涌入企业开发流程,攻击模型一旦被武器化,后果来得会非常直接。如果攻击者能够操控提示词或者污染模型偏好,仓库里整条审计链可能从头到尾都干干净净——每个提交单独审查都合情合理,只有组合起来才会触发灾难。开发者大概率会以为是自己写出了烂代码,而真正的祸源,正安静地藏在AI补全的那几行建议里。

当“VibeCoding”式的AI编程成为标配,每跑一次流水线,你怎么确定那一连串看似无害的提交里,没藏着一个被切成六份的后门?下一次Code Review,或许该盯着的不止是diff,还得问问身边那个AI助手——它到底在为谁敲代码?

http://www.jsqmd.com/news/1132171/

相关文章:

  • 【Python环境】从零解读PyCharm项目结构:虚拟环境、外部库与uv包管理器
  • DQN 高估问题深度解析:3 种成因与双 DQN 等 2 类解决方案对比
  • 沃尔安智能摄像机删除后的恢复方法
  • 郑州高口碑黄金回收白银回收
  • 超参数调优进阶:Optuna/Bayesian/Early Stopping
  • 出行和货运行业正在被智能体重塑,效率提升超过50%
  • PCB布线设计 2025:3W/20H/蛇形线等5大核心规则实战解析与量化验证
  • C++ 线程安全日志系统:策略模式解耦输出端,RAII 实现 glog 风格流式日志
  • 集成隔离电源的RS-485/RS-422收发器:PCB拼接电容设计实战与EMC优化
  • nlpconnect/vit-gpt2-image-captioning 超详细入门解析
  • Java---牛客的ACM模式被卡输入输出时间,如何解决?一个模版即可解决
  • AI 音频生成流水线:异步任务要有进度和取消
  • 基于社交图谱的校园活动与交友系统(SpringBoot + Neo4j + UniApp)
  • 舟山高口碑黄金回收白银回收
  • 2025黑科技!加持会议任务提醒,快准稳颠覆你的认知?
  • Flutter 开发鸿蒙实战:Windows 环境下从 HAP 构建到四 Tab 页面运行
  • MT7621 PCIe WiFi 驱动移植:从 5.4 内核到 OpenWrt 22.03 的 3 个关键步骤
  • 对比聚类 (Contrastive Clustering) 与 SimCLR 深度对比:3 个核心差异与 2 个应用场景分析
  • C++26 std::inplace_vector 详解:零堆分配的定容向量
  • C++26 std::chrono 哈希与 SI 词头详解
  • Want 参数安全:类型、边界、异常兜底怎么写
  • 机器学习系统设计:从原型到生产
  • 开始委托之旅 委托与接口
  • 张掖口碑黄金铂金回收白银回收实体老店
  • 大模型提示词工程分类
  • 加捻织唛与不加捻织标区别及织唛商标行业3大互联网推广方式
  • 高效制作专业幻灯片的完全指南:Marp for VS Code实用教程
  • AI时代,企业核心业务中台化建设思考
  • AI编程实战:从RAG系统构建看大模型应用开发的核心逻辑
  • AI基础概念入门----prompt