Codex App 64K最优开发配置|舍弃1M冗余上下文,大幅降低无效Token消耗
日常新增功能、修复BUG仅改动少量文件,64K上下文足以覆盖绝大多数开发场景,没必要使用1M超大上下文;该配置本地模型、在线API模型全部通用:本地部署优化Token输出速率,在线调用减少计费Token损耗,使用者可按需自行上调至128K。
1. .codex/config.toml
model = "gpt5.5" 或"qwen3.6-35b-a3b" model_context_window = 64000 model_auto_compact_token_limit = 56000 compact_min_interval_ms = 90000 compact_recent_turns_keep = 5 max_tool_output_tokens = 1024如需更大窗口,自行修改
model_context_window = 128000,同步把压缩阈值改为model_auto_compact_token_limit = 112000
2. .codex/AGENTS.md
# 全局开发约束规则 1. 常规开发新增功能、BUG调试仅修改少量文件。 2. 代码变更仅输出Diff差异片段,严禁返回完整源码文件,避免大量Token浪费。 3. 持续增量维护项目状态清单,仅追加新增改动内容,已记录信息不再重复复述、改写。 4. 状态记录维度:当前任务、已完成事项、待办列表、文件变更、问题修复、目录调整、关键架构决策。 5. 执行内置 /compact 压缩时:同步更新项目状态,剔除重复代码、冗余终端日志,严格保留最近5轮原始对话。 6. 全程遵循极简输出原则,已有上下文内的信息不再额外赘述,持续降低Token消耗。 禁止删除任何文件。 中文回复。使用说明
- 将配置文件放入对应目录后重启Codex
- Token用量达到阈值时自动触发内置压缩
- 需要手动精简上下文,直接输入指令:
/compact
