当前位置：首页 > news >正文

OpenAI发布最强网络安全模型GPT - 5.5 - Cyber，却曝出Codex「烧穿硬盘」漏洞！

news 2026/6/24 2:16:40

「满血」GPT - 5.5 - Cyber登场强压Mythos 5

刚刚，OpenAI重磅发布「满血版」GPT - 5.5 - Cyber，这是迄今为止最强大的网络安全模型，专为经授权的高级防御任务量身定制。在权威CyberGym基准测试中，它拿下85.6%高分，击败Mythos 5。

其核心能力涵盖追踪漏洞代码、验证安全隐患、生成补丁，并为人工审查提供证据。

OpenAI这次下了血本，甩出网安计划Daybreak（破晓）的三大核心战略，核心叙事是AI已改变网络安全的「物理定律」。此次发布核心是GPT - 5.5 - Cyber完整版，是OpenAI迄今最强的「网络安全专用模型」，给「经过验证的防御者」的最强网安工具。

在CyberGym基准上，它拿到85.6%的单模型最高分，普通版GPT - 5.5是81.8%，Claude Opus 4.7是73.1%。在考核「能不能把漏洞变成真实攻击代码」的ExploitGym上，Cyber版39.5% VS 普通版25.95%；在考核长链条漏洞挖掘的SEC - bench Pro上，Cyber版69.8% VS 普通版63.1%。三个基准，满血Cyber版全面碾压GPT - 5.5。

Codex塞进「AI安全工程师」亮出「破晓」之刃

如果说GPT - 5.5 - Cyber是矛，那Codex Security就是盾。OpenAI更新了Codex Security插件，将其融入Codex工作流，实现开箱即用的漏洞扫描、威胁建模、攻击路径追踪、补丁自动生成一条龙。其逻辑是在每个程序员身边塞一个安全工程师。

自今年3月研究预览上线以来，Codex Security已扫描超3000万次提交，覆盖3万多个代码仓库。其中，人工复核确认修复的发现超7万个，自动判定修复的超50万个。

修补地球，成了KPI

OpenAI发起了Patch the Planet（修补地球）计划。因为开源世界中，被广泛使用的开源项目里，94%的项目一年内90%以上的新增代码靠不到10个开发者。AI让「找漏洞」变快，却给维护者带来灾难，大量低质量误报。

「修补地球」核心是专业人工，研究员先去重、验证，把干净的补丁给维护者。首批30多个开源项目承诺加入，包括cURL、Go、Python、Sigstore、pyca/cryptography等。一个五天冲刺在19个项目里发现数百个问题、合并了数十个补丁。

此外，OpenAI启动Daybreak（破晓）网络安全合作伙伴计划，通过Cisco、CrowdStrike、Palo Alto Networks、Cloudflare等近30家安全巨头的产品，将模型能力输送到众多组织。在政府层面，OpenAI已和美、英、欧盟的ENISA等机构建立「可信网络安全访问」合作。

Codex狂写日志一年烧穿一块SSD

几乎同一时间，Codex被曝出「史诗级」漏洞。有GitHub开发者发现，Codex在流式传输和自动化长任务时，会以约5MB/s（实测峰值甚至到16MB/s）的速度，往本地~/.codex/logs_2.sqlite的SQLit日志文件里写TRACE日志。一年约写640TB，而一块普通消费级SSD标称写入寿命约600TB，这会榨干SSD寿命。

一位GitHub用户1996fanrui实测，机器开机运行21天，主SSD被写入约37TB数据，罪魁祸首是Codex的SQLite日志。该文件在疯狂「写入再删除、写入再删除」，每分钟上万次插入与清理，文件不大，但实际写入量远超肉眼所见。

这个问题最早在今年4月有人提issue（#17320），之后不断有人反馈，如#24275、#22444，6月14日的#28224影响较大。OpenAI更新日志碰了碰SQLite的稳定性，但未修复「写入速率」问题，issue仍开放。