当前位置: 首页 > news >正文

Codex 子代理:串行 vs 并行,快多少

系列:AI 编程工具生态挖掘 | 字数:约 2800 字 | 预计阅读:7 分钟


前面几篇都在 Claude Code 生态里打转。但 Codex 这边有一个 Claude Code 不具备的能力——原生子代理(Sub-Agent)并行编排。

Codex 支持在.codex/agents/下定义专用 Agent,每个有独立的系统提示、工具权限和模型。Codex 可以同时启动多个 Agent 并行执行不同任务,然后汇总结果。

社区做了大量封装——136+ 预定义子代理、50+ 可复用工作流、跨 LLM 编排。这篇文章不列清单,做一个实战对比:同一个需求,串行做 vs 并行做,差距到底多大。


Codex 子代理工作原理——.toml 定义,主 session 调用

.codex/agents/下定义一个 Agent 文件:

# .codex/agents/test-writer.toml name = "test-writer" description = "Writes pytest tests for Python functions" tools = ["read", "write", "bash"] model = "gpt-5.1" system_prompt = """ You are a test engineer. Given a Python source file, write comprehensive pytest tests. Focus on edge cases, boundary values, and error conditions. Use parametrize for combinatorial coverage. Output ONLY the test file content — no explanations. """

然后在主 Codex session 里调用:

用户: 用 test-writer 给 src/utils/date_utils.py 写测试 同时用 code-reviewer 审查 src/utils/date_utils.py 的代码质量 然后我去泡杯咖啡

Codex 会同时启动 test-writer 和 code-reviewer 两个 Agent,并行运行。Agent 之间没有上下文共享——各干各的。


串行 vs 并行实测——同一需求,两种跑法差多少

任务:给一个中等复杂度的 Python 工具模块(date_utils.py,180 行,12 个函数)做三个操作——写测试、代码审查、生成文档。

串行模式:

一个接一个来。先让 Codex 写测试,完了再审查,完了再生成文档。

Step 1: Write tests → 4 min 12 sec Step 2: Code review → 3 min 48 sec Step 3: Generate docs → 2 min 05 sec Total: 10 min 05 sec

测试覆盖了 12 个函数中的 11 个(漏了一个私有 helper),审查发现了 3 个问题(2 个类型标注缺失、1 个潜在的时区 bug),文档准确描述了 12 个函数的参数和返回值。

并行模式:

三个 Agent 同时启动:

Agent 1 (test-writer): → Writing tests... → 4 min 52 sec Agent 2 (code-reviewer): → Reviewing code... → 4 min 18 sec Agent 3 (doc-writer): → Generating docs... → 2 min 35 sec All agents completed. Total: 4 min 52 sec (wall clock)

并行模式墙钟时间约 5 分钟,比串行快了接近一半。但有两个代价:

  • test-writer 慢了 40 秒(Agent 并发竞争资源,模型推理排队)
  • test-writer 没看到 code-reviewer 发现的问题——审查发现的时区 bug,测试里刚好也漏了

并行什么时候划算

划算的场景:

  • 多个任务操作不同文件,互不依赖
  • 代码审查 + 测试编写——这两个天然独立
  • 大型重构——拆成多个子模块,每个 Agent 处理一个
  • 多语言项目——一个 Agent 改前端,一个 Agent 改后端

不划算的场景:

  • 任务之间有顺序依赖——Agent A 的输出是 Agent B 的输入,并行等于乱序
  • 操作同一个文件——两个 Agent 同时改同一个文件会产生冲突
  • 需要全局视角的任务——并行 Agent 各自为政,看不到其他人的分析

值得装的 6 个子代理

从 VoltAgent 的 136+ 子代理里,挑了几个最实用的:

Agent用途一句话
code-reviewer代码审查按漏洞、风格、性能逐项审查
test-writer测试生成自动 parametrize 组合覆盖率
doc-writer文档生成读函数签名和 docstring,输出 Markdown
security-scanner安全扫描OWASP Top 10 检查,硬编码密钥检测
refactor-agent大型重构拆解重构计划,分步执行,每步验证
dependency-checker依赖审计检查过时的包、已知漏洞、许可证冲突

安装单个 Agent:

npx skills@latestaddVoltAgent/awesome-codex-subagents

然后在 Codex session 里通过/agent test-writer调用。


Agent 之间的通信——别指望他们会聊天

并行 Agent 最大的陷阱:你不会自动得到"综合报告"

三个 Agent 各自输出了结果——测试代码、审查报告、文档。但它们不会互相沟通。你得做汇总的人:

用户: 汇总 test-writer、code-reviewer 和 doc-writer 的输出, 合并成一个完整的 PR 准备报告

或者用社区工具——agent-sh/agentsys提供了一个编排层,定义了 Agent 间的输入/输出协议,自动汇总。但它还在 preview 阶段,文档不全。

目前的建议:并行 Agent 用来生成,人用来汇总。不要指望 Agent 之间自动协调。


Codex 子代理 vs Claude Code 并行——调度方式和隔离程度不同

Codex 子代理Claude Code 并行
调度方式原生支持,.toml配置通过 SubAgent tool,内置支持
Agent 隔离独立上下文,独立执行共享上下文,子 Agent 可传结果
适用场景完全独立的任务并行需要主 Agent 汇总的并行
配置复杂度需要定义每个 Agent 的系统提示自动继承 CLAUDE.md 规则

Codex 的子代理更适合"不同视角"的并行——安全 Agent 看安全、测试 Agent 看测试、文档 Agent 看文档。Claude Code 的子代理更适合"分块处理"的并行——主 Agent 拆任务,子 Agent 各领一块。


技能超市:1400+ 个技能里的质量筛选

GitHub 上 1400+ 个 Codex/Claude Code 技能,社区测试了 100 个,70% 不合格。几个筛选标准:

过滤掉:

  • "用最佳实践"类——空泛,没具体行为约束
  • 只做一件事但描述不清的——装完不知道什么时候触发
  • 跟其他已有技能功能重复的

留住的:

  • 有明确的触发条件(“当 X 时做 Y”)
  • 有具体的输出格式要求
  • 有已知的限制说明(“不适用于 Z 场景”)

两个网站帮你找:

  • claudeskills.info— 151+ 技能,支持中文,兼容 14+ 平台
  • skillsmp.com— 多平台技能市场

下一篇

并行多 Agent 能提效,但也扩大了攻击面——多个 Agent 同时跑,安全风险被放大了。下一篇同时测 AgentShield(安全扫描)和 cozempic(token 成本优化),看看防守端和成本端社区做了什么。

http://www.jsqmd.com/news/926359/

相关文章:

  • AI裁员:管理者不会被AI替代——但「管理」正在被重新定义
  • 【系统学AI】20 Agent计费策略:从Devin到Manus的5大定价案例
  • Windows下彻底告别有道云笔记自动更新:手动修改app-update.yml文件保姆级教程
  • 2026年短视频分发效率升级:一款工具如何让你多平台发布节省80%时间
  • 24V转±15V/5V三路稳压电源板:LM5575+LM7815+LM7915方案,含AD原理图与PCB源文件
  • 实测对比:在老旧笔记本和最新M1 Mac上,LibreOffice 7.4和OpenOffice 4.1谁更流畅?
  • 2026年白色硅灰厂家选型技术推荐:纳米级微硅粉/超细微硅粉/四川微硅粉厂家/四川硅灰/核心指标解析 - 优质品牌商家
  • MATLAB版GA-PSO混合优化代码包:含交叉选择机制、双测试数据与详细中文使用指南
  • Spring AI 源码解析(二):ChatModel 调用链路与消息处理
  • 手把手教你:在Docker容器或WSL里修复Ubuntu的systemctl命令报错(附原理图解)
  • AI写论文的宝藏工具!4款AI论文写作助手,让你的写作过程更顺畅
  • 你的无线网卡支持Monitor模式吗?在Ubuntu上快速自查与选购指南(避坑无线网卡驱动)
  • 循环结构:死循环,循环嵌套
  • 如何用VinXiangQi打造你的智能象棋AI助手:从零开始到专业级分析
  • 深入xv6内核:为每个进程创建独立内核页表到底解决了什么问题?
  • 同样叫 OpenClaw,为什么 .NET 版和原生版根本不是一回事
  • AI 写代码的安全性漏洞与 Token 浪费,两个工具搞定
  • Matlab版柔性车间调度工具包:用NSGA-II同时压缩短工期和降能耗
  • 运维效率翻倍:用Xmanager + SSH隧道安全访问内网Linux图形界面(保姆级配置)
  • Browser Use — AI驱动浏览器自动化的全新范式
  • Word文档样式一致性检查与批注批量导出工具(Python实现)
  • 保姆级教程:在Linux上从零配置TongLINKQ 8.1.15.2客户端,实现与服务端通信
  • 光学加密技术如何革新音频安全防护
  • 2026 青岛纹眉门店实地体验测评:多家门店综合实力盘点 - 小艾信息发布
  • JDK8 Optional详解入门:彻底告别Java空指针异常
  • Beyond Compare 5逆向工程:RSA非对称加密授权机制深度解析与密钥生成器实战
  • Cora和Citeseer数据集上可直接运行的GCN链路预测代码包(含预处理、训练与评估)
  • 2026年台州税务代理公司选对=合规高效 企赢税务智能财税推荐(含联系方式) - 本地品牌推荐
  • 2026年Trae与Claude Code优缺点对比:深度横评解析
  • MATLAB近场动力学三模型对比包:含稳定化实现、零能模式修正与能量/位移可视化