当前位置: 首页 > news >正文

Codex 用户集体暴怒!Token疯狂蒸发的 5 个原因终于找到了

最近不少朋友都有一个感受,就是codex怎么消耗变快了。

之前是100刀的Pro会员随便用,根本用不完(额度那个时候有翻倍)。

后续发现100刀的Pro开始不够用了,甚至到最后200刀的刀Pro也开始不够用了。

就在2026 年 6 月底,开发者社区集体不干了,开始控诉codex的消耗异常。

大量用户报告 Codex 的 token 消耗出现严重异常,有人一条 prompt 下去,5 小时额度直接归零;有人花 200 美元买了 Pro 20x,结果三四个小时就用完了临时额度。



大批用户在社交媒体上集体 @ Codex 产品负责人 Tibo Sottiaux 讨要说法。

几天后,Tibo 终于做出正式回应,承认系统存在多个叠加问题,并连续做了多轮全局额度重置。


而在 6 月 30 日,这次“额度异常”的正式调查结果终于出炉,Tibo 此前的推测居然也没中。

按照 Tibo 的报告,这次并不是某一个单点 bug 把额度系统干崩了,而是多个问题在特定用户场景下叠加放大,换句话说,是“亿点点问题在一起爆了”。

简单来看,主要问题集中在几个方面:

  • 自动代码审查触发频率过高
  • 任务拆解机制异常,导致触发更多子任务
  • 失败 prompt 在后台发生重复重试
  • 用量统计与分类显示出现偏差

目前,OpenAI 已经回滚了相关改动,并修复了重复生成、重复调度和异常重试的问题。

事实上,早在 2025 年底 Codex 出现计费异常时,团队就采取过一次激进修复——直接重写了计费与使用追踪系统的底层逻辑。

但即便如此,Codex 的额度问题依然没有彻底消失。

额度故障一波接一波,官方重置也一轮接一轮。

出于对 Codex 疯狂重置的好奇,我们认真研究了这次的故障报告,也翻了翻 Codex 过去和各种额度 bug 斗智斗勇的历史记录。

最后,我们扒出了五条 Codex 额度疯狂燃烧的原因。



原因一:Codex的回答本身就很耗Token

当Codex发出去 prompt的时候, Codex 内部可能被拆解成了好几个环节:理解意图、扫描项目结构、读取相关文件、生成代码、自动审查代码质量、验证修改是否正确……每一个环节都在消耗 token。

尤其是 auto-review(自动代码审查)这个功能在某些版本中,它的触发逻辑被调得过于激进。

你根本没有主动要求它进行审查,但 Codex 已经自作主张地在后台启动了分析流程。

原因二:Cloud 任务和本地任务共用一个额度

2025 年底之前,Codex 的云端任务(Cloud Task)和本地 CLI 任务各有各的额度池——互不干扰。

但后来,OpenAI 悄悄把两者合并成了一个共享额度池,没有公告,没有更新日志。

问题在于,云端任务和本地任务的 token 消耗根本不在一个量级。

每个云端任务启动时会拉起一个独立的沙箱容器,光是加载环境上下文就可能吃掉 15 万到 30 万 token。

而本地一个轻量级 prompt 可能只消耗几千 token。

原因三:失败的任务不退钱

这大概是整个 Codex 额度体系中最让人无语的设计。

当一个 Codex 任务挂起、超时或者执行失败的时候,系统不会退还已经消耗的 token。

其次就是,Codex 的重试机制在某些情况下过于激进。

一个任务失败了,AI 不会停下来,而是会自动尝试启动重试、分叉出新的子任务、甚至在后台重复调度已经失败的流程。

在 6 月底那次重大故障中,Tibo 明确提到这种"失败 prompt 在后台重复重试"是导致额度异常消耗的重要原因之一。

原因四:两套计时系统不对

Codex 的额度系统有两层限制:一个是 5 小时滚动窗口限制,一个是每周总额度限制。理论上,这两个窗口应该按比例联动,保持一致的消耗节奏。


但现实是,它们的计算逻辑并不同步。

社区发现,在 CLI v0.40.0 版本中,5 小时窗口的额度恢复 2% 时,每周额度只恢复 1%。这意味着如果你在短时间内集中使用 Codex 完成一个大型重构任务,5 小时额度可能还剩一些空间,但你的周额度已经被不成比例地消耗殆尽了。

OpenAI 后来承认这是一个 bug,也给受影响的用户发放了补偿。

原因五:Codex 在偷偷加班

除了上面那些执行层面的问题,还有一个容易被忽视的后台消耗大户:记忆预览功能(Memory Preview)。

这个功能会持续抓取你的屏幕上下文,用来"补全"AI 的短期记忆,让连续对话更自然。

听起来确实很好用?但问题是它会一直在后台运行,持续消耗 token。

也就是说,哪怕你放下电脑去吃饭、去遛弯、去睡觉,只要 Codex 开着,这个功能可能就在后台默默刷新你的上下文信息。

这个可以手动关掉,在设置的「个性化 → 记忆」里把它关闭就行。

如何节约Codex Token

目前也有用户在社区分享了许多自己节省Token的技巧,大家可以参考一下。

以下是综合社区经验和技术分析后整理出来的几个实用方法:

精简你的 AGENTS.md 文件。这是最容易被忽视但效果最显著的一招。

很多人的 AGENTS.md 文件随着项目迭代已经膨胀到了几千行,而每次 prompt 都会把这个文件完整加载进上下文。有开发者实测,精简 AGENTS.md 后 token 消耗降低了 30%-40%。


缩小工作区范围。如果你的项目是一个大型 monorepo,不要在根目录打开 Codex。

把工作区限定到你当前实际操作的子目录下,可以显著减少上下文加载的 token 开销。

日常任务用小模型。不是所有任务都需要上最强的 GPT-5.5。

简单的代码修改、格式调整、配置文件编辑这些活儿,用 codex-mini 就够了,token 消耗低得多。把重型模型留给真正需要深度推理的复杂任务。


关掉不需要的 MCP 服务。每个 MCP server 启动时都会往上下文里加载工具 schema,配的越多,每次会话的基础开销就越大。只留当前任务真正用得上的。

养成查余额的习惯。在 CLI 里跑一下/status,在大型任务前确认自己还剩多少额度。

尤其是预估会超过 10 万 token 输入的任务,先确认余量再动手。


好了,以上就是这篇文章的所有内容~,如果觉得文章不错的话,记得一键三连支持~

http://www.jsqmd.com/news/1123692/

相关文章:

  • 计算机毕业设计之基于Java的旅游网站的设计与实现
  • 无人直升机外形设计流程分享
  • 10分钟搭建第一个RAG问答系统
  • WorkshopDL:免费开源Steam创意工坊下载器,一键解锁742款游戏的跨平台模组体验
  • Transformers.js:重新定义浏览器端AI开发的颠覆性框架
  • C#集成YOLOv8目标检测:ONNX Runtime本地部署实战指南
  • Topit:如何在Mac上实现多窗口置顶管理,终极效率提升指南
  • C++自绘DateTime:分段自定义色彩加eee毫秒格式支持
  • ST-GCN 行为识别实战:基于 OpenPose 骨架提取,NTU RGB+D 60 数据集准确率达 85%
  • Python简史
  • 【Springboot毕设全套源码+文档】基于springboot个性化音乐推荐系统的设计与实现(丰富项目+远程调试+讲解+定制)
  • 第四章 QT窗口
  • 国内合规使用大模型指南:避开Gemini代理陷阱
  • Kali Linux学习路线图:从零到精通的网络安全实战指南
  • TI高精度实验室系列(运放):06 压摆率简介
  • 豆包vs Deepseek:不是谁更聪明,而是谁更适合你的具体任务
  • Linux服务器宝塔面板安装图文教程|告别命令行,小白也能轻松运维
  • OpenCV 4.8 频域水印实战:DCT变换嵌入Logo,PSNR 40+ 抗压缩测试
  • Allegro PCB设计中的高效元件查找技巧与实战应用
  • OpenCV实战教程:从环境搭建到人脸识别项目开发
  • 一文讲懂 Agent 核心术语:ReAct、Tool Calling、State、Memory、Workflow 到底是什么
  • 影刀RPA 版本控制与团队协作:流程导出导入-Git管理实战
  • Windows → Windows VSCode Remote SSH 不同子网下的配置流程
  • CNN图像分类实战:从数据到部署全流程解析
  • AI短视频制作:抖音同款背影杀视频全攻略
  • 爬虫转大模型:换个角度用业务场景检验技术取,从岗位要求反推能力栈
  • 智能控制面板PCB设计:触控灵敏度与流畅度优化指南
  • 人工智能与机器学习实战:从入门到部署全流程指南
  • 基于YOLOv8与OpenCV的实时目标检测系统构建与优化指南
  • 华为MetaERP Oracle EBS中核心模块的典型业务场景及对应会计分录。由于无法直接生成Excel文件下载,我将以结构化的Markdown表格形式呈现,你可以直接复制到Excel中保存使用。