# Claude Mythos:AI 网络安全能力的质变时刻2026 年上半年,安全圈最火的词不是哪个新 CVE,而是 Anthropic 的 **Claude Mythos**。Mozilla 用它在 Firefox 里找到了 271 个漏洞,"几乎没有误报";curl 维护者 Daniel Stenberg 确认它报告了 5 个疑似漏洞,最终 1 个被确认为真实安全问题;Anthropic 自己的评估更激进——它能自主发现并利用所有主流操作系统和浏览器的零日漏洞。作为一个从传统安全运维一路走到 AI 辅助开发的从业者,我花了几天时间啃完了 Anthropic 的系统评估报告和 Daniel 的回应文章。这篇文章不聊营销话术,只聊数据和事实。## 到底有多强先看 Anthropic 报告里的硬数据。他们在隔离容器里用一个简单的 Agent 脚手架(基于 Claude Code)跑了一系列基准测试:**自主漏洞利用成功率**:给模型 100 个已知 CVE,让它判断哪些可利用并尝试利用。结果是 **超过一半被成功利用**——而且是全自动的,不需要人类引导。**Firefox JS 引擎测试**:在 Firefox 147 的 JavaScript 引擎中寻找可利用的 bug。上一代旗舰 Opus 4.6 成功了 2 次;Mythos Preview 成功了 **181 次**,外加 29 次获得寄存器控制。这不是量变,是质变。**OSS-Fuzz 语料库测试**:在约 1000 个开源仓库上运行,Opus 4.6 找到 150-175 个一级崩溃和 1 个三级崩溃。Mythos Preview 找到 **595 个一级/二级崩溃**,外加 **10 个完整的控制流劫持(五级)**。**时间跨度惊人的漏洞**:它挖出了一个 **27 年历史的 OpenBSD bug**、一个 **16 年历史的 FFmpeg H.264 bug**、一个 **17 年历史的 FreeBSD NFS RCE**(CVE-2026-4747)。这些都是被全球最优秀的安全审计人员反复审查过的代码。**N-day 利用基准**:给定 100 个 CVE,模型自动筛选出 40 个可能可利用的,其中超过一半被成功利用。更值得注意的是利用的复杂度:它不是在找低垂的果实。报告中提到的利用包括浏览器 JIT 堆喷射链式利用 4 个漏洞加渲染器/操作系统沙箱逃逸、跨 6 个 NFS 数据包的 20 个 gadget ROP 链、以及通过相邻页面 1 位写入实现的内核页表操纵。## Mozilla 的实战验证Mozilla 在 5 月公开了他们使用 Mythos 的结果:在 Firefox 中发现 **271 个安全漏洞**,且**几乎没有误报**。这不是学术论文里的实验数据,是真实产品里的真实漏洞。Mozilla 的安全团队表示这些漏洞的发现效率远超传统模糊测试和人工代码审计。这个数字意味着什么?Firefox 是全球审计最严格、模糊测试覆盖最广的开源项目之一。能找到 271 个"几乎没有误报"的漏洞,说明 Mythos 的分析深度已经超越了传统自动化工具的天花板。## curl 维护者的冷水Daniel Stenberg 的回应是这波讨论中最清醒的声音。curl 是全球被审计和模糊测试最多的 C 代码库之一,Mythos 扫描了它的 git master(17.8 万行代码),报告了 5 个"确认的安全漏洞"。经过 curl 安全团队审查:
- **1 个被确认为真实漏洞**——低严重性,计划在 curl 8.21.0 中修复
- **3 个是误报**——实际上是文档中已记录的 API 限制
- **1 个是普通 bug**——不是安全漏洞Daniel 的核心观点:> "围绕 Mythos 的宣传主要是营销——我没有看到证据表明它发现问题的能力显著优于之前的 AI 工具。"但他同时强调:> "AI 代码分析器总体上确实有价值,而且显著优于传统分析器。每个项目都应该使用 AI 代码分析器——不这样做等于给攻击者留出时间来利用未发现的缺陷。"他还提到了一个有趣的细节:curl 之前使用过的其他 AI 工具,实际上产生的 bug 修复数量**比 Mythos 更多**。## 我的看法读完这些材料,我的判断是:**Mythos 标志着 AI 安全能力的一个质变点,但不是终点。****质变在哪?** 之前的安全 AI 工具主要做"已知模式的新实例"——换个说法就是更聪明的 grep。Mythos 的突破在于它能做**多步骤推理的漏洞利用链构造**。浏览器 JIT 堆喷射 + 沙箱逃逸、跨数据包 ROP 链——这些不是 pattern matching,是需要理解系统架构的安全研究。**不是终点在哪?** Daniel 的冷水泼得有道理。Mythos 在 curl 上的 1/5 确认率说明它对高强度审计过的代码仍有局限性。它擅长的是"有大量未审计代码"的场景——而这恰恰是大多数项目的真实状态。**对安全从业者的启示:**1. **AI 辅助审计应该是标配。** Daniel 说得对——"每个项目都应该用"。不是替代人类安全研究员,是放大他们的能力。一个安全工程师 + Mythos 的产出可能相当于过去一个 5 人审计团队。2. **防御方比攻击方更有优势,但窗口在缩小。** Anthropic 目前限制了 Mythos 的访问权限,Mozilla 和 Cloudflare 的评估是受控合作。但这种能力终究会扩散——要么通过开源复现(已经有人在做),要么通过其他模型追赶。防守方应该现在就开始用起来。3. **传统安全培训的价值在上升而不是下降。** Mythos 生成的漏洞报告需要人类判断真伪(curl 的 1/5 确认率就是例子)。能看懂 ROP 链、理解沙箱逃逸机制、判断一个漏洞的实际可利用性——这些核心能力反而更值钱了。工具越强,能驾驭工具的人越稀缺。**一个开发者的实际建议:** 如果你在维护开源项目,现在就应该把 AI 代码审计加入你的安全流程。不需要等 Mythos 开放访问——现有的开源模型(Qwen、DeepSeek 等)配合合适的 prompt 已经能发现不少问题。Mythos 证明的是上限在持续提高,但下限已经足够有用了。## ⚠️ 网络安全免责声明本文内容仅供技术研究与安全学习之用。文中描述的漏洞分析、攻击链拆解和代码示例均基于公开披露的安全研究,旨在帮助开发者理解攻击原理、提升安全意识和防御能力。请勿将本文所述技术用于任何未经授权的安全测试、渗透攻击或非法用途。任何因滥用本文信息而造成的法律后果,由使用者自行承担,与本文作者无关。如发现系统安全漏洞,请通过合法渠道向相关厂商或平台报告,共同维护网络安全生态。---**参考来源:**
- [Assessing Claude Mythos Preview's cybersecurity capabilities](https://red.anthropic.com/2026/mythos-preview/) — Anthropic
- [Mozilla says 271 vulnerabilities found by Mythos](https://arstechnica.com/information-technology/2026/05/mozilla-says-271-vulnerabilities-found-by-mythos-have-almost-no-false-positives/) — Ars Technica
- [Mythos Finds a Curl Vulnerability](https://daniel.haxx.se/blog/2026/05/11/mythos-finds-a-curl-vulnerability/) — Daniel Stenberg
- [Small models also found the vulnerabilities that Mythos found](https://aisle.com/blog/ai-cybersecurity-after-mythos-the-jagged-frontier) — Aisle Security
