当前位置: 首页 > news >正文

OpenAI发布最强网络安全模型GPT - 5.5 - Cyber,却曝出Codex「烧穿硬盘」漏洞!

「满血」GPT - 5.5 - Cyber登场 强压Mythos 5

刚刚,OpenAI重磅发布「满血版」GPT - 5.5 - Cyber,这是迄今为止最强大的网络安全模型,专为经授权的高级防御任务量身定制。在权威CyberGym基准测试中,它拿下85.6%高分,击败Mythos 5。

其核心能力涵盖追踪漏洞代码、验证安全隐患、生成补丁,并为人工审查提供证据。

OpenAI这次下了血本,甩出网安计划Daybreak(破晓)的三大核心战略,核心叙事是AI已改变网络安全的「物理定律」。此次发布核心是GPT - 5.5 - Cyber完整版,是OpenAI迄今最强的「网络安全专用模型」,给「经过验证的防御者」的最强网安工具。

在CyberGym基准上,它拿到85.6%的单模型最高分,普通版GPT - 5.5是81.8%,Claude Opus 4.7是73.1%。在考核「能不能把漏洞变成真实攻击代码」的ExploitGym上,Cyber版39.5% VS 普通版25.95%;在考核长链条漏洞挖掘的SEC - bench Pro上,Cyber版69.8% VS 普通版63.1%。三个基准,满血Cyber版全面碾压GPT - 5.5。

Codex塞进「AI安全工程师」 亮出「破晓」之刃

如果说GPT - 5.5 - Cyber是矛,那Codex Security就是盾。OpenAI更新了Codex Security插件,将其融入Codex工作流,实现开箱即用的漏洞扫描、威胁建模、攻击路径追踪、补丁自动生成一条龙。其逻辑是在每个程序员身边塞一个安全工程师。

自今年3月研究预览上线以来,Codex Security已扫描超3000万次提交,覆盖3万多个代码仓库。其中,人工复核确认修复的发现超7万个,自动判定修复的超50万个。

修补地球,成了KPI

OpenAI发起了Patch the Planet(修补地球)计划。因为开源世界中,被广泛使用的开源项目里,94%的项目一年内90%以上的新增代码靠不到10个开发者。AI让「找漏洞」变快,却给维护者带来灾难,大量低质量误报。

「修补地球」核心是专业人工,研究员先去重、验证,把干净的补丁给维护者。首批30多个开源项目承诺加入,包括cURL、Go、Python、Sigstore、pyca/cryptography等。一个五天冲刺在19个项目里发现数百个问题、合并了数十个补丁。

此外,OpenAI启动Daybreak(破晓)网络安全合作伙伴计划,通过Cisco、CrowdStrike、Palo Alto Networks、Cloudflare等近30家安全巨头的产品,将模型能力输送到众多组织。在政府层面,OpenAI已和美、英、欧盟的ENISA等机构建立「可信网络安全访问」合作。

Codex狂写日志 一年烧穿一块SSD

几乎同一时间,Codex被曝出「史诗级」漏洞。有GitHub开发者发现,Codex在流式传输和自动化长任务时,会以约5MB/s(实测峰值甚至到16MB/s)的速度,往本地~/.codex/logs_2.sqlite的SQLit日志文件里写TRACE日志。一年约写640TB,而一块普通消费级SSD标称写入寿命约600TB,这会榨干SSD寿命。

一位GitHub用户1996fanrui实测,机器开机运行21天,主SSD被写入约37TB数据,罪魁祸首是Codex的SQLite日志。该文件在疯狂「写入再删除、写入再删除」,每分钟上万次插入与清理,文件不大,但实际写入量远超肉眼所见。

这个问题最早在今年4月有人提issue(#17320),之后不断有人反馈,如#24275、#22444,6月14日的#28224影响较大。OpenAI更新日志碰了碰SQLite的稳定性,但未修复「写入速率」问题,issue仍开放。

官方回复:已修复

OpenAI研究员Vaibhav (VB) Srivastav回应,这一问题已修复,并随最新Codex版本发布。他提醒所有人通过npm、bash安装脚本将Codex升级到最新版本。

同一个智能,能修补地球,也能烧穿硬盘。当AI改写网络安全的「物理定律」,也改写了人类「看得见」的边界。黎明已至,只是这光会不会让我们看不清自己的造物?

http://www.jsqmd.com/news/1069993/

相关文章:

  • 初尝Docker容器
  • XMEGA A3U DAC与AC实战:从精密波形生成到硬件级快速保护
  • ATA5279天线驱动芯片Boost转换器与电流调节环路设计实战指南
  • AVR单片机无感BLDC驱动:BEMF过零检测与六步换相实战详解
  • LLaMA-Factory 原生支持 ROCm 是真的香,配合 HIPify 几分钟完成环境验证
  • 1.4 面试:Function Calling(函数调用)
  • 进程、线程、协程与Java虚拟线程
  • 【项目实践:位掩码状态设计方案】
  • 基于ATA8510-EK1的Sub-GHz无线传感器网络快速开发实践
  • 聚铭网络实力入选嘶吼《2026 AI+网络安全产业图谱》8大细分领域
  • 专业的跨境电商合规方案哪个好
  • BitCloud SDK实战:SAMR21与ATmegaRFR2 Zigbee节点固件烧录与配置指南
  • 048、从MemRef到LLVM的最终降级路径
  • 汽车LIN SBC集成设计:ATA663232/55芯片选型、硬件与调试全解析
  • 用 LLM-as-judge 给 Agent 答案自动打分
  • Microchip嵌入式开发资源全攻略:从数据手册到社区支持的高效导航
  • Origin 2025 下载Origin2025安装教程——科学绘图与数据分析入门
  • 企业云盘选型避坑指南:5个中小团队最容易踩的文档管理误区
  • text2sql 怎么把表结构喂给模型
  • 广州做小程序的公司有哪些,哪家更靠谱?
  • ATtiny1634 EEPROM编程与时钟配置实战:嵌入式低功耗设计核心
  • DeepSeek 出来的内容如何去除 # 和 ** 符号?用 DS随心转整理成 Word 更省事
  • Meilisearch:一个为搜索速度而生的开源引擎
  • 自动采集数据集指南
  • 主表 + 扩展表设计模式
  • 制造业质量大迁徙:LIMS如何走出实验室,奔向供应链与全生命周期
  • 基于Microchip ATA8520评估套件的SIGFOX物联网节点开发实战指南
  • 2026年GEO信源媒体发稿平台全盘点:三种模式、代表玩家与适用场景
  • 【2026】FreeOK官网入口,一键直达在线观看
  • 基于ATA6663/ATA6664的LIN收发器开发板实战指南:从硬件连接到软件调试