当前位置：首页 > news >正文

Codex Subagent 配置深度指南：从 config.toml 到生产级中文智能体

news 2026/6/22 0:18:42

1. 项目概述：Subagent 不是插件，而是 Codex 的“分身大脑”

Codex App Windows 版本里，“Subagent”这个词被很多人误读成一个可开关的附加功能，就像浏览器里的广告屏蔽插件一样——点一下启用，再点一下关闭。但实际完全不是这么回事。我从2023年Codex刚发布测试版就开始跟进，完整跑过6个大版本迭代，也帮超过40位企业用户部署过生产环境。Subagent 的本质，是 Codex 架构中唯一被设计为可独立配置、可自主决策、可跨任务继承上下文的智能代理单元。它不依赖主界面存活，甚至可以在 Codex 主进程退出后，通过 Windows 服务方式继续监听本地 API 端口，处理后台任务。你看到的“config.toml”文件，90%以上的字段，其实都是在为 Subagent 的行为建模：它该用什么模型、能访问哪些本地资源、如何解析用户指令中的隐含意图、在多长的上下文窗口内做推理、遇到错误时是否自动降级重试……这些都不是界面按钮能控制的。

为什么这个认知特别关键？因为所有搜索“codex配置subagent”“codex config.toml”“claude subagent”的人，真正卡住的地方，从来不是不会改文件，而是改了之后发现“没反应”“中文设置不生效”“上下文长度限制还是512”。问题根源几乎全出在：把 Subagent 当成一个功能模块去调，而不是把它当成一个需要独立“养育”的智能体去配置。比如热词里反复出现的“codex设置中文不生效”，背后真实原因是config.toml中language = "zh-CN"这一行只影响主界面语言，而 Subagent 的语言偏好必须通过subagent.default_prompt_template指向一个包含中文系统指令的模板文件路径才能生效；又比如“condex配置config.toml上下文长度限制”，很多人直接改context_length = 8192，却忽略了 Codex 的 Windows 版本底层使用的是 llama.cpp 的量化推理引擎，而该引擎对 context length 的实际支持上限，取决于你加载的.gguf模型文件本身是否包含llama.context_length元数据——如果模型文件是用旧版 llama.cpp 量化生成的，即使你写 16384，运行时也会被强制截断回 4096。这些细节，官方文档一页都没提，但你在 Windows 上真正想让 Subagent “从用顺到真正高手”，就必须亲手踩一遍。

我今天这篇教程，不讲怎么下载安装包、不演示点击哪里点几下，就聚焦一件事：让你亲手把 Subagent 的 config.toml 文件，从一个“能跑起来”的配置，变成一个“懂你工作流、守你数据边界、扛得住复杂任务”的生产级配置。适合三类人：一是已经装好 Codex 但总觉得“不够聪明”的中级用户；二是正在评估 Codex 替代国产 Office 免费版 Windows 场景（比如合同比对、标书生成、会议纪要结构化）的技术负责人；三是想把 Codex 接入自有知识库（比如用 Redis 做向量缓存、用 Elasticsearch 做全文检索）的开发者。接下来所有内容，都基于 Codex v2.4.7 Windows x64 正式版 + Windows 11 23H2 环境实测，所有路径、参数、命令均截图验证过三次以上。

2. Subagent 核心架构与 config.toml 设计逻辑拆解

2.1 Subagent 在 Codex 中的真实定位：三层代理模型

Codex 的 Windows 版本，其核心推理调度并非单线程直连模型，而是采用明确的三层代理架构。这和很多用户凭直觉理解的“Codex = 本地版 Claude”有本质区别。我画过不下20张流程图，最终确认它的执行链路是这样的：

第一层是UI Agent（界面代理）：负责渲染主窗口、处理鼠标键盘事件、管理菜单栏和状态栏。它完全不参与任何模型推理，只做“传话筒”。当你在界面上点击“新建文档”或拖入一个 PDF，UI Agent 只是把原始文件路径和用户操作动作打包成 JSON，发给第二层。

第二层是Orchestrator（编排器）：这是 Codex 的“中央调度室”，运行在codex.exe主进程中。它不直接调用模型，而是根据config.toml中的orchestrator.strategy字段决定任务分发策略。默认值是"adaptive"，意思是：如果当前任务是纯文本生成（如写邮件），就交给 Subagent；如果是文件解析（如提取 Word 表格），就启动一个临时的file-parser-worker.exe子进程；如果是联网搜索，则调用内置的web-search-bridge.dll。Orchestrator 会持续监控各子进程的内存占用和响应延迟，一旦 Subagent 连续3次超时（默认阈值 8s），它会自动切换到备用策略，比如降级使用更小的模型或启用缓存结果。这个机制解释了为什么很多人改了subagent.model_path却感觉“没变化”——Orchestrator 在后台悄悄做了熔断。

第三层才是Subagent（子代理）：这才是真正的“大脑”。它是一个独立的、基于 Rust 编写的轻量级 HTTP 服务（监听127.0.0.1:8081），有自己的线程池、自己的 token 计数器、自己的上下文管理器。config.toml中所有以subagent.开头的配置项，都是直接喂给这一层的。它不读取 UI 界面的任何状态，只认config.toml和它自己加载的 prompt 模板。这也是为什么“codex设置中文不生效”——UI 的语言设置和 Subagent 的语言设置，压根不在同一个配置域里。

提示：你可以用netstat -ano | findstr :8081在命令行验证 Subagent 是否真的在运行。如果返回空，说明 Orchestrator 因某种原因（比如模型文件损坏、GPU 显存不足）主动停掉了它，此时改config.toml是无效的。必须先解决底层运行时问题。

2.2 config.toml 文件结构全景图：哪些字段真正在驱动 Subagent？

Codex 的config.toml是一个典型的 TOML 配置文件，但它的字段组织非常有讲究。我按实际影响力，把全部 127 个字段（v2.4.7 版本）重新归类为四类，其中只有第 3 类是 Subagent 的“命脉”：

全局基础类（21 个字段）：如app.name、app.version、log.level。这些只影响 Codex 主程序自身行为，修改后需重启整个应用。对 Subagent 无直接影响。
Orchestrator 控制类（33 个字段）：如orchestrator.timeout_ms、orchestrator.max_concurrent_tasks、orchestrator.fallback_model。这些是 Subagent 的“顶头上司”，决定它何时被调用、能同时干几件事、出错时找谁救场。改这些字段，Subagent 的行为会间接改变，但不是根本性调整。
Subagent 核心驱动类（48 个字段）：这才是本篇教程的绝对主角。它们全部以subagent.为前缀，覆盖模型加载、上下文管理、提示工程、安全沙箱、性能调优五大维度。比如：
- subagent.model_path = "models/deepseek-v4-pro.Q5_K_M.gguf"：指定加载哪个量化模型文件，路径必须是绝对路径或相对于config.toml所在目录的相对路径。
- subagent.context_window = 12288：告诉 Subagent “最多允许我塞给你多少 token 的上下文”，但注意，这只是上限，实际可用长度还受模型文件元数据和显存限制。
- subagent.prompt_template_path = "prompts/zh-cn-system-v2.txt"：指向一个纯文本文件，里面是 Subagent 每次推理前自动拼接的系统指令。这才是控制“中文是否生效”的真正开关。
- subagent.sandbox.enabled = true：开启沙箱后，Subagent 将无法访问C:\Users\之外的任何路径，也无法执行cmd.exe或powershell.exe，这是保障企业数据不出域的关键。
兼容与扩展类（25 个字段）：如extensions.redis.enabled、extensions.elasticsearch.url。这些是为未来接入第三方服务预留的钩子，目前大部分字段在 Windows 版本中尚无实际作用，属于“占位符”。

注意：网上流传的很多“config.toml 修改教程”，把ui.language和subagent.prompt_template_path混为一谈，导致用户改了前者发现没用，就以为是软件 Bug。实际上，ui.language只控制菜单、按钮、对话框的文字，而subagent.prompt_template_path里的内容，决定了 Subagent 输出的每一段文字的语气、格式、专业术语——这才是你真正想让它“变聪明”的地方。

2.3 为什么必须手写 config.toml？图形界面永远做不到的事

Codex 的 Windows 客户端确实提供了一个“设置”面板，可以点选模型、调节滑块改上下文长度、勾选“启用中文”。但这个界面，本质上只是config.toml的一个极简前端，它只暴露了不到 15% 的真实配置能力。我做过一个对照实验：在设置面板里把上下文长度拉到最大（显示为“16K”），保存后打开config.toml，发现subagent.context_window字段被写成了16384；但当我手动把这个值改成12288并保存，再回到设置面板，滑块会自动跳回中间位置，显示为“12K”。这说明图形界面的数值是“只读映射”，它不能反向同步你手写的精细配置。

更关键的是，图形界面完全无法触及 Subagent 的核心能力边界。比如：

它不能让你指定subagent.temperature = 0.35来稳定代码生成的确定性；
它不能让你配置subagent.stop_sequences = ["\n\n", "<|eot_id|>"]来精准截断输出；
它不能让你启用subagent.rag.enabled = true并关联本地知识库路径；
它甚至不能让你禁用subagent.web_search.enabled = false—— 这个开关在界面里根本不存在，但如果你的企业内网禁止外联，这个字段不关，Subagent 就会在每次推理后偷偷发起 DNS 查询，触发安全审计告警。

所以，“手写 config.toml”不是极客炫技，而是 Windows 用户获得 Subagent 全部能力的唯一合法途径。它就像汽车的 ECU 刷写，厂商提供的“经济模式”“运动模式”按钮，永远无法替代你自己调校的喷油脉宽和点火提前角。

3. 手把手实战：从零构建一个生产级 Subagent 配置

3.1 准备工作：确认环境、获取模型、创建安全目录结构

在动 config.toml 之前，必须确保底层环境干净可靠。我见过太多用户卡在第一步：模型文件放错位置、权限不足、路径含中文。以下是经过 12 次重装验证的标准化流程：

第一步：确认 Codex 运行环境

操作系统：Windows 11 22H2 或更新版本（Windows 10 21H2 也可，但需额外安装 Visual C++ 2015-2022 运行库）。
硬件要求：最低 16GB 内存（推荐 32GB），NVIDIA GPU（RTX 3060 及以上，显存 ≥12GB）；若无独显，CPU 必须为 Intel i7-11800H 或 AMD Ryzen 7 5800H 及以上，并确保 Windows 已启用“Windows Hypervisor Platform”（在“启用或关闭 Windows 功能”里勾选）。
验证方法：启动 Codex 后，按Ctrl+Shift+I打开开发者工具，切换到 Console 标签页，输入window.runtimeInfo，回车。你会看到一个 JSON 对象，重点检查gpu.available是否为true，cpu.arch是否为"x64"，memory.total_gb是否 ≥16。如果gpu.available是false，别急着改配置，先去 NVIDIA 控制面板确认“CUDA”是否被禁用。

第二步：获取并验证模型文件

Codex 官方推荐模型是deepseek-v4-pro，但 Windows 版本实际支持所有 llama.cpp 兼容的.gguf文件。我实测最稳的是Q5_K_M量化级别（平衡精度与速度）。不要下载Q8_0（太吃显存）或Q2_K（精度损失太大，代码生成错误率飙升）。
下载地址：从 Hugging Face 的TheBloke/deepseek-v4-pro-GGUF仓库下载deepseek-v4-pro.Q5_K_M.gguf文件（约 4.2GB）。注意：必须下载.gguf文件，不是.bin或.safetensors。
验证完整性：用 PowerShell 运行Get-FileHash .\deepseek-v4-pro.Q5_K_M.gguf -Algorithm SHA256，对比 HF 页面上标注的 SHA256 值。如果不符，说明下载中断，必须重下。我遇到过 3 次因网络抖动导致哈希值错一位，结果 Subagent 启动时报invalid model header，查了两天才发现是文件损坏。

第三步：创建符合 Windows 安全规范的目录结构Codex 对路径权限极其敏感。我建议严格按以下结构创建（全部使用英文路径，避免空格和中文）：

C:\codex\ ├── config.toml ← 主配置文件 ├── models\ │ └── deepseek-v4-pro.Q5_K_M.gguf ← 模型文件 ├── prompts\ │ └── zh-cn-system-v2.txt ← 中文系统提示模板 └── knowledge\ └── contracts\ ← 你的私有知识库（可选）

关键操作：右键C:\codex文件夹 → “属性” → “安全” → “编辑” → 确保当前用户（如DESKTOP-XXX\YourName）拥有“完全控制”权限。这是 Windows 版本独有的坑——如果权限不足，Subagent 会静默失败，日志里只有一行failed to open model file，根本不会告诉你缺权限。

3.2 config.toml 核心字段详解与安全配置实践

现在进入正题。打开C:\codex\config.toml，我们逐段构建一个真正可用的配置。以下内容全部基于 v2.4.7，每个字段我都附上为什么这么设和不这么设的后果。

# === 全局基础配置（保持默认即可，除非你有特殊需求）=== app.name = "Codex" app.version = "2.4.7" log.level = "info" # 生产环境建议设为 "warn"，避免日志爆炸；调试时用 "debug" # === Orchestrator 控制配置（为 Subagent 创造稳定运行环境）=== [orchestrator] timeout_ms = 12000 # Subagent 单次任务最长 12 秒。设太短（如 5000）会导致复杂任务被粗暴中断；设太长（如 30000）会让 UI 卡死。 max_concurrent_tasks = 2 # Windows 系统下，超过 2 个并发 Subagent 任务，显存极易爆满。别信网上说的 "4" 或 "8"。 fallback_model = "models/deepseek-v4-pro.Q5_K_M.gguf" # 当主模型加载失败时的备胎，路径必须和主模型一致。 # === Subagent 核心驱动配置（这才是重点！）=== [subagent] # 【模型加载】 model_path = "models/deepseek-v4-pro.Q5_K_M.gguf" # 必须是相对路径！Codex 会自动拼接 C:\codex\ 前缀。绝对路径在这里会失效。 n_gpu_layers = 45 # RTX 3060 12GB 的黄金值。计算公式：模型总层数（用 llama.cpp 的 `llama-cli -m xxx.gguf -p "test"` 查看）× 0.85。deepseek-v4-pro 共 53 层，45 层上 GPU，剩下 8 层 CPU 推理，速度和显存完美平衡。 main_gpu = 0 # 如果你有多块 GPU，0 是第一块。别乱设，设错会报 CUDA_ERROR_INVALID_DEVICE。 # 【上下文管理】 context_window = 12288 # 不是越大越好！实测 12288 是 deepseek-v4-pro 在 12GB 显存下的安全上限。设 16384 会触发 OOM，Subagent 直接崩溃。 cache_capacity = 512 # 上下文缓存大小（token 数）。设太小（如 64）会导致重复提问时丢失历史；设太大（如 2048）会吃光显存。512 是最佳甜点区。 # 【提示工程】 prompt_template_path = "prompts/zh-cn-system-v2.txt" # 这是中文生效的核心！下面会详细讲这个文件怎么写。 temperature = 0.35 # 代码/技术文档生成，0.35 是稳定性和创造力的平衡点。0.1 太死板，0.7 太发散。 top_p = 0.9 # 配合 temperature 使用，过滤掉概率过低的 token，让输出更连贯。 stop_sequences = ["\n\n", "<|eot_id|>", "```"] # 三个终止符：双换行、模型原生结束符、代码块结束符。没有这个，Subagent 可能无限输出。 # 【安全沙箱】 sandbox.enabled = true # 强烈建议开启！开启后 Subagent 只能访问 C:\codex\ 及其子目录。这是企业部署的生命线。 sandbox.allowed_paths = ["knowledge/", "prompts/"] # 明确授权可读取的知识库和提示模板路径。别加 "*"，那等于没开沙箱。 sandbox.blocked_commands = ["cmd", "powershell", "git", "curl"] # 禁止执行任何 shell 命令，防 RCE。 # 【性能与可靠性】 num_threads = 8 # CPU 线程数。设为你物理核心数（不是逻辑线程数）。我的 i7-11800H 是 8 核，所以设 8。设 16 会因上下文切换反而变慢。 repeat_penalty = 1.1 # 降低重复率。1.0 是不惩罚，1.2 是强惩罚。1.1 是通用推荐值。 presence_penalty = 0.15 # 惩罚已出现过的 token。0.15 能有效避免“的的的”这种病句。

实操心得：n_gpu_layers是 Windows 用户最容易调错的参数。很多人看到“GPU 加速”就盲目设成999，结果 Subagent 启动时显存瞬间占满 100%，然后报CUDA out of memory。正确做法是：先用llama-cli -m models/deepseek-v4-pro.Q5_K_M.gguf -p "test"查出模型总层数（53），再乘以 0.85，得到 45。这个值在 RTX 3060/4070/4080 上都验证过，显存占用稳定在 85%-92%，留有足够余量应对突发负载。

3.3 编写 zh-cn-system-v2.txt：让 Subagent 真正“懂中文”的秘密武器

prompt_template_path指向的这个文件，才是 Subagent 的“灵魂”。它不是一个简单的语言开关，而是一套完整的角色设定、任务约束和输出规范。我为你准备了一个经过 37 次迭代、在合同审核、技术方案撰写、会议纪要生成三大场景实测有效的模板：

你是一名资深的中文技术文档工程师，专注于将复杂信息转化为清晰、准确、专业的中文表达。请严格遵守以下规则： 【角色与身份】 - 你精通中国法律法规、行业标准（GB/T 系列）、以及主流办公软件（WPS/Office）的文档规范。 - 你从不虚构事实、不编造数据、不引用未提供的信息。所有回答必须基于用户提供的上下文。 - 你的语言风格：正式、简洁、无歧义。避免口语化词汇（如“咱们”、“搞定”）、网络用语（如“yyds”、“绝绝子”）和模糊表述（如“大概”、“可能”）。 【输出格式规范】 - 技术文档/合同条款：使用编号列表（1. 2. 3.），每条独立成段，首句即核心结论。 - 会议纪要：按“时间-人物-议题-结论-待办”五要素结构化输出，待办事项必须包含明确责任人（如“张三：于 5 月 10 日前提交接口文档”）。 - 代码生成：必须包含完整可运行的代码块（用 ```python 或 ```sql 包裹），且代码块内不得有注释占位符（如 `# TODO`），必须是即用型。 【安全与合规】 - 绝对禁止访问互联网、调用外部 API、或生成任何涉及个人隐私、商业机密、国家秘密的内容。 - 如果用户请求超出你的能力范围（如“帮我黑进某公司服务器”），请回复：“根据中国网络安全法，我无法执行此请求。” 现在，请开始处理用户的请求：

把这个文本复制粘贴到C:\codex\prompts\zh-cn-system-v2.txt文件中，保存为 UTF-8 编码（非常重要！用记事本保存时，务必在“另存为”对话框底部选择“编码：UTF-8”，否则会出现乱码）。

为什么这个模板有效？因为它解决了三个致命痛点：第一，【角色与身份】段落让 Subagent 明确自己是“中文技术文档工程师”，而不是一个泛泛的“AI助手”，这直接提升了专业术语的准确率；第二，【输出格式规范】用具体例子定义了什么是“清晰”，比单纯说“请用中文回答”有力一万倍；第三，【安全与合规】段落不是摆设，Codex 的 Subagent 引擎会实时解析这段文字，并在生成过程中进行 token 级别的约束，一旦检测到输出中出现“黑进”“破解”等关键词，会立即截断并返回预设的合规响应。这是我在线上客户环境中，唯一通过等保三级安全审计的配置方案。

3.4 验证与调试：如何确认你的 Subagent 配置真的生效了？

改完config.toml和zh-cn-system-v2.txt，别急着关掉编辑器。必须做三步验证，缺一不可：

第一步：检查 Subagent 是否成功加载模型

关闭 Codex 主程序。
用管理员权限打开 PowerShell，导航到C:\codex，运行：
```
.\codex.exe --log-level debug
```

观察控制台输出。当看到类似以下三行时，说明成功：

[INFO] Subagent: Loading model from models/deepseek-v4-pro.Q5_K_M.gguf... [INFO] Subagent: Model loaded successfully. Layers on GPU: 45, on CPU: 8. [INFO] Subagent: HTTP server started on http://127.0.0.1:8081

如果卡在第一行，或出现Failed to load model: ...，立刻检查model_path路径是否正确、文件是否存在、权限是否足够。

第二步：用 curl 直接调用 Subagent API，绕过 UI 干扰

Codex 的 Subagent 提供了一个标准的 OpenAI 兼容 API。在 PowerShell 中运行：

$body = @{ model="deepseek-v4-pro"; messages=@(@{role="system"; content="你是谁？"}; @{role="user"; content="用一句话介绍你自己"}) } | ConvertTo-Json -Depth 10 Invoke-RestMethod -Uri "http://127.0.0.1:8081/v1/chat/completions" -Method Post -Body $body -ContentType "application/json"

如果返回一个包含content字段的 JSON，且内容是中文（如“我是一名资深的中文技术文档工程师...”），恭喜，你的prompt_template_path和sandbox都生效了。如果返回{"error": "Forbidden"}，说明沙箱拦截了请求，检查sandbox.allowed_paths是否漏了prompts/。

第三步：在 Codex UI 中做“压力测试”

启动 Codex，新建一个空白文档。
粘贴一段 3000 字的合同文本（确保包含“甲方”“乙方”“违约责任”等关键词）。
输入指令：“请逐条列出本合同中甲方的主要义务，并用编号列表呈现。”
观察：
- 响应时间是否在 8-12 秒内（orchestrator.timeout_ms的体现）？
- 输出是否严格按编号列表（stop_sequences和prompt_template的体现）？
- 是否出现“根据您提供的合同文本”这类废话（prompt_template中“所有回答必须基于用户提供的上下文”的体现）？
- 如果一切符合预期，你的 Subagent 已经从“能用”升级为“好用”。

4. 高阶技巧与避坑指南：让 Subagent 真正成为你的“第二大脑”

4.1 知识库接入实战：用本地文件夹实现 RAG，无需 Redis 或 Elasticsearch

很多热词提到“redis下载安装配置windows”“dify 在线升级 windows”，但其实 Codex 的 Subagent 内置了轻量级 RAG（检索增强生成）能力，完全不需要额外部署 Redis 或 Elasticsearch。它的原理很简单：把你的知识库（PDF、Word、TXT）放在C:\codex\knowledge\下，Subagent 会自动对其进行分块、嵌入、向量化，并建立内存索引。整个过程在后台静默完成，不暴露任何命令行。

操作步骤：

在C:\codex\knowledge\下创建子文件夹，如contracts\、standards\、manuals\。
把你的文件放进去（支持.pdf,.docx,.txt,.md）。

在config.toml中启用 RAG：

[subagent.rag] enabled = true knowledge_base_path = "knowledge/" chunk_size = 512 # 每个文本块的最大 token 数。512 是通用推荐值。 top_k = 3 # 每次检索返回最相关的 3 个块。

重启 Codex。首次启动时，Subagent 会花 1-3 分钟扫描并索引所有文件（日志里会显示RAG: Indexing 12 files...）。

效果验证：在文档中输入：“根据《GB/T 22239-2019》等保2.0标准，三级系统必须满足哪些网络架构要求？” Subagent 会自动从knowledge\standards\下的 PDF 中检索相关内容，并整合进回答。实测在 10GB 知识库下，平均响应延迟增加不到 2 秒，远低于部署一套 Redis 的运维成本。

注意：RAG 索引是内存驻留的，不是持久化存储。这意味着每次 Codex 重启，Subagent 都会重新扫描文件。这不是 Bug，而是设计——它保证了知识库的实时性。如果你有海量文件（>1000 个），建议用脚本定期合并为几个大文件，减少扫描次数。

4.2 多国语言无缝切换：一个配置文件，三种语言输出

热词里有“windows多国语言”“cc switch windows 安装”，其实 Codex 的 Subagent 支持运行时语言切换，根本不需要装多个客户端。秘诀在于prompt_template_path的动态加载。

操作步骤：

创建三个提示模板文件：
- C:\codex\prompts\zh-cn-system-v2.txt（中文，前面已写好）
- C:\codex\prompts\en-us-system-v2.txt（英文，把中文模板里的所有描述翻译成专业英文）
- C:\codex\prompts\ja-jp-system-v2.txt（日文，同理）

在config.toml中，不直接写死路径，而是用环境变量：

[subagent] prompt_template_path = "prompts/${LANG:-zh-cn}-system-v2.txt"

启动 Codex 前，设置系统环境变量：
- 中文：set LANG=zh-cn，然后运行codex.exe
- 英文：set LANG=en-us，然后运行codex.exe
- 日文：set LANG=ja-jp，然后运行codex.exe

这样，你只需要维护一份config.toml，就能让同一个 Codex 安装，服务于不同语言的团队成员。我在一个跨国项目组里用这个方案，项目经理用英文模板写需求，开发用中文模板写文档，测试用日文模板写用例，零冲突。

4.3 性能调优终极指南：在 16GB 内存的笔记本上跑满 Subagent

不是每个人都有 RTX 4090。我实测过，在一台 16GB 内存、无独显的 Dell XPS 13（i7-1165G7）上，如何让 Subagent 依然可用：

模型选择：放弃deepseek-v4-pro，改用phi-3-mini-128k-instruct.Q4_K_M.gguf（仅 2.2GB）。它在 16GB 内存下，n_gpu_layers = 0（全 CPU 推理），context_window = 4096，响应时间约 15-20 秒，但胜在稳定。

关键配置：在config.toml中强制关闭所有非必要功能：

[subagent] n_gpu_layers = 0 context_window = 4096 cache_capacity = 128 web_search.enabled = false # 彻底禁用联网 rag.enabled = false # 禁用知识库，省内存 sandbox.enabled = false # 沙箱本身有开销，笔记本上可关 num_threads = 4 # i7-1165G7 是 4 核 8 线程，设 4 最稳

系统级优化：在 Windows 设置 → 系统 → 电源 → 选择“最佳性能”模式；在任务管理器 → 性能 → CPU → 右键“更改电源计划” → 选择“高性能”。这两步能让 CPU 长期维持在 3.0GHz 以上，避免降频导致推理时间翻倍。

实测心得：很多人抱怨“codex离线安装包”在笔记本上卡顿，问题往往不在 Codex，而在 Windows 默认的“平衡”电源计划。它会让 CPU 在 1.2GHz 频率下运行，而 llama.cpp 的推理是纯 CPU 密集型，频率低一半，时间就多一倍。这个细节，99% 的教程都不会提。

4.4 常见问题速查表：那些让你抓狂的“玄学问题”真相

问题现象	真实原因	解决方案	我踩过的坑
“codex安装 windows桌面版”后打不开，黑窗口一闪而过	缺少 Visual C++ 2015-2022 运行库，或 .NET Framework 4.8 未启用	控制面板 → 程序 → 启用或关闭 Windows 功能 → 勾选 ".NET Framework 4.8 Advanced Services"；然后去微软官网下载并安装 "Microsoft Visual C++ 2015-2022 Redistributable"	我第一次装时，只装了 x64 版本，忘了 x86，结果 Codex 的某些 DLL 加载失败，黑屏。必须 x64 和 x86 都装。
“codex配置第三方api”后，Subagent 一直报 403 错误	Codex 的 Windows 版本，默认启用了严格的 TLS 1.2+ 策略，很多老 API（如某些自建的 Flask 服务）只支持 TLS 1.0	在`config.toml`中添加`[subagent.http] insecure_skip_verify = true`（仅限内网测试环境！生产环境必须升级 API 服务端 TLS）	客户的旧 ERP 系统 API 就是 TLS 1.0，我花了三天查防火墙、查代理、查证书，最后发现是这个配置。
“windows安装docker”后，Codex 启动报 port 8081 conflict	Docker Desktop 默认会占用`127.0.0.1:8081`，和 Subagent 冲突	在 Docker Desktop 设置 → General → 取消勾选 "Use the WSL 2 based engine"；或在`config.toml`中改`subagent.http.port = 8082`	这个冲突极其隐蔽，日志里只显示 "address already in use"，不告诉你哪个进程占的。用 `netstat -ano
“codex汉化”后，生成的代码注释还是英文	`ui.language`只影响界面，代码注释由 `prompt_template_path