当前位置：首页 > news >正文

OMC - 08 在多 Agent 时代，如何优雅地「分工协作」：oh-my-claudecode 委托分类体系深度解读

news 2026/6/22 2:04:07

文章目录

Pre
概述
一、问题背景：为什么需要「委托分类」？
二、两个核心轴：功能类别与成本层级
- 2.1 功能类别：Agent 在团队中的职能
- 2.2 成本层级：给调度器的预算信号
三、从架构泳道看多 Agent 协作「流水线」
- 3.1 典型流水线：从探索到验证
- 3.2 领域 Agent：按需并入流程
四、触发器与路由：Agent 不是随便上的
- 4.1 Agent 触发器：`triggers + useWhen + avoidWhen`
- 4.2 自动构建「委派参考表」
五、成本感知：在质量与账单之间求平衡
- 5.1 AgentCost：谁可以被频繁调用？
- 5.2 `-low` / `-high` 模型变体：工程上非常好用的「档位开关」
六、委派强制器：别再让模型选择变成「意外之喜」
- 6.1 pre-tool-use Hook：模型注入的「中间检查站」
- 6.2 实战意义：从「运气」变成「制度」
七、角色边界与「委派纪律」
- 7.1 关键角色边界示意
- 7.2 为什么这些边界重要？
八、什么时候该委派？什么时候直接做？
- 8.1 建议委派的场景
- 8.2 适合直接处理的场景
九、运行时可配置：AgentOverrideConfig 的设计价值
- 9.1 可覆盖字段一览
- 9.2 实战建议
十、从设计到实践：如何把这套思路用在自己的系统里？

Pre

OMC - 01 用 19 个 Agent 打造你的 Claude Code“工程团队”：oh-my-claudecode 深度解析与实战指南

OMC - 02 五分钟起步，走向多智能体协作：深入解析 oh-my-claudecode 快速开始与架构设计

OMC - 03 从 0 到高效：Oh My ClaudeCode 安装与实践全指南

OMC - 04 用好 Oh-My-ClaudeCode 的 30 个会话技能：从“帮我写点代码”到端到端自动交付

OMC - 05 从单人到多 Agent：Oh-my-claudecode 的插件架构解析

OMC - 06 从“大模型管家”到“十九人专家团队”：oh-my-claudecode 的多 Agent 工程实践

OMC - 07 把「选模型」当成一门工程学：oh-my-claudecode 的三层模型路由实践

概述

大模型应用已经从「单一聊天助手」走向「多 Agent 协作系统」。如何在一个系统里管理十几个甚至几十个专用 Agent，让它们在合适的时机、以合适的成本、用合适的模型出手，是现在做 AI 编排的开发者绕不开的问题。

oh-my-claudecode 给出了一套相对完整的答案：用功能类别 + 成本层级对 Agent 建模，用触发规则驱动委派，用中间件强制模型路由，从而把「谁来做」「用什么算」「什么时候出手」这三个问题系统化。

这篇文章尝试用工程视角，把这一套委托分类体系拆开讲清楚，并结合一些实战思路，帮你在自己的多 Agent 系统里落地类似的设计。

一、问题背景：为什么需要「委托分类」？

在多 Agent 编排场景中，常见的几个痛点：

职责混乱：所有请求都丢给一个“大而全”的 Agent，提示词越来越肥，行为越来越不可控。
成本失控：本来一个简单搜索任务，结果动不动就拉起最贵的模型，按 token 付费的同学看着账单直冒冷汗。
路由玄学：到底什么时候该交给规划 Agent？什么时候该找专家 Agent？往往靠「感觉」写 if-else，很难维护。
行为漂移：明明只想让某个 Agent 做只读分析，它却顺手把代码改了，还不一定改对。

oh-my-claudecode 的委托分类体系，核心就是把这些“玄学路由”和“隐性约定”全部显性化，用类型系统和中间件来约束。

它围绕三个关键问题展开设计：

角色划分：一个 Agent 在系统中的工作本质是什么？
预算控制：调用它贵不贵？可以被调用多少次？
路由规则：在什么场景下应该把任务交给它？在哪些情况下必须避开它？

接下来我们从这三个维度往下拆。

二、两个核心轴：功能类别与成本层级

在 oh-my-claudecode 中，每个 Agent 都有两条「标签」：功能类别（AgentCategory）和成本层级（AgentCost）。

2.1 功能类别：Agent 在团队中的职能

功能类别定义了 Agent 在「开发生命周期」中的角色，而不是技术实现细节。简化后，你可以理解为下面这张表：

类别	核心作用	默认模型	典型 Agent	设计感受
exploration	代码搜索、结构摸底	haiku	explore	快速扫街
specialist	具体实现、专精执行	sonnet	executor、designer 等	干活的人
advisor	只读咨询、架构分析	opus	architect	首席顾问
utility	通用写作、轻量辅助	haiku	writer	打下手的
orchestration	协调多 Agent、驱动流水线	sonnet	编排器类 Agent	调度中心
planner	战略规划、任务拆解	opus	planner、analyst	项目经理
reviewer	质量关卡、审查与验证	opus	critic、code-reviewer 等	质检员

这种划分有两个好处：

一眼看出「这是一个什么性格的 Agent」：是负责造轮子的，还是负责挑毛病的。
方便在路由和提示词中做统一约束：比如所有 reviewer 都明确「不写代码，只看问题」。

2.2 成本层级：给调度器的预算信号

第二个轴是成本层级（AgentCost），本质上是给编排器看的预算提示：

FREE：几乎不计成本的调用（通常是内置逻辑，或者非 LLM 部分）
CHEAP：低成本、高吞吐量的 Agent，适合高频调用
EXPENSIVE：推理质量高但昂贵的 Agent，适合关键决策节点

系统中会根据这个层级，配合模型层级（haiku / sonnet / opus）来做默认路由：例如 CHEAP 多半对应 haiku 或 sonnet，EXPENSIVE 则往 opus 靠。

这里有一个非常实用的设计：成本层级是“信号”，不是绑定。
比如 executor 既是 specialist，又标记为 CHEAP，但它默认模型选择的是 sonnet——说明在当前系统里，sonnet 也被视作可接受的低成本选项。

三、从架构泳道看多 Agent 协作「流水线」

功能类别是「纵向」的角色标签，而在架构层面，oh-my-claudecode 还把 Agent 按照开发流程分成了四条「泳道」：

Coordination Lane：负责整体协调和编排（比如 critic）
Review Lane：负责各种形式的审查与质量关卡
Build/Analysis Lane：负责具体实现和分析（explore、analyst、planner、executor 等）
Domain Lane：负责特定领域的专家能力，比如 designer、security-reviewer、test-engineer 等

3.1 典型流水线：从探索到验证

在这一架构下，一个典型的端到端 Agent 工作流大致是：

explore → analyst → planner → critic → executor → verifier

拆开看一下每个环节的职责：

explore：在代码库和项目结构中摸底，找到相关文件、模块和调用关系。
analyst：在执行前做「问题分析」，补齐隐形需求、边界条件和风险点。
planner：根据分析结果拆分任务，形成可执行计划与步骤列表。
critic：站在质量视角审查计划——是否漏情况、是否有明显坑。
executor：按计划逐步改代码、写测试、跑命令，真正「动手」。
verifier：验证变更结果，比如跑测试、检查 diff 合理性。

这一条流水线的好处在于：每个环节只做一个类型的决策或动作。
如果你自己要设计多 Agent 系统，可以直接沿用这条主干，再根据业务加减领域 Agent。

3.2 领域 Agent：按需并入流程

当任务涉及特定领域时，流程会「支路」调用相应专家 Agent：

UI 或交互相关：叫上 designer。
测试策略与用例设计：找 test-engineer，或者 qa-tester。
安全与合规：拉 security-reviewer 参与审查。
文档与说明书：交给 document-specialist 或 writer。

这些领域 Agent 通常挂在 Domain Lane，由协调层或 planner 决定是否「插入」流水线。

四、触发器与路由：Agent 不是随便上的

有了角色和泳道，还需要回答一个关键问题：什么时候该委派给谁？
在 oh-my-claudecode 里，这部分由一套「触发器 + 指南」体系来驱动。

4.1 Agent 触发器：`triggers + useWhen + avoidWhen`

每个 Agent 的元数据中，都包含一组触发定义：{ domain, trigger }，同时配套useWhen和avoidWhen说明。

举几个代表性的例子（非原文照搬，按含义重新整理）：

Agent	领域	触发条件示例	备注
explore	代码库搜索	查找实现、模式、文件位置	优先用于「找东西」
executor	直接实现	单文件范围、需求明确的改动	不做规划与委派
architect	架构决策/调试	跨系统权衡、多次失败的疑难 Bug	高成本顾问
planner	任务规划	大型变更、跨模块重构、长任务	生成计划
analyst	需求与风险分析	问题背景不清晰、有明显隐性约束	计划前分析
critic	计划审查	在执行前对计划质量进行评估	质量关卡

在此基础上：

useWhen用清单式语言说明「特别适合」的场景，例如“多文件重构”“系统性调优”。
avoidWhen则反过来列出「应该避免」的场景，例如 explore 的 avoidWhen 中明确写到：
- 外部文档搜索应该交给 document-specialist
- 复杂架构问题应交给 architect
- 已知文件路径的简单查找不需要任何委派，直接做就行

这个组合让路由逻辑可以从硬编码 if-else，转化成一份可维护的「配置式规则」。

4.2 自动构建「委派参考表」

为了让编排 Agent 在运行时可以使用这些规则，系统提供了一些工具函数：

buildDelegationTable()：把所有 Agent 的 trigger 信息汇总成一张 Markdown 表，注入到编排器的系统提示中，让协同 Agent 对「谁擅长什么」有一张一目了然的导航图。
buildKeyTriggersSection()：构建一个关键词到 Agent 的映射参考，方便通过模式匹配为任务选择候选 Agent。

换句话说，编排器在做决策时，有一个「知识库」：
——哪些场景适合哪个 Agent，上面已经通过配置提前写好了。

五、成本感知：在质量与账单之间求平衡

在实践中，很多系统刚上线的时候对模型成本没多大感觉，一旦接入真实用户、长会话、多轮协作以后，账单的增长速度就会开始提醒你：需要一个成本感知的委派策略。

5.1 AgentCost：谁可以被频繁调用？

前面提到，AgentCost 大致分为 CHEAP 和 EXPENSIVE（还有 FREE）。在 oh-my-claudecode 中，不同 Agent 被标记在不同的成本层级，下表是一个简化示意：

成本层级	含义	典型模型	Agent 示例
CHEAP	低成本、高调用频率	haiku / sonnet	explore、executor、designer、writer 等
EXPENSIVE	高质量推理、慎重调用	opus	architect、planner、analyst、critic 等

这套标记给了调度器两个能力：

在长会话中限制 EXPENSIVE Agent 的调用次数或总 Token。
在开关「成本敏感模式」时，优先使用 CHEAP 阵容处理更多任务，实在不行才升级。

5.2`-low`/`-high`模型变体：工程上非常好用的「档位开关」

为了在不修改 Agent 定义的情况下调节成本，系统引入了一个很工程化的小约定：
在 Agent 类型后加-low或-high后缀，代表显式降级或升级模型层级。

例如对 executor：

默认：executor→ sonnet
低成本版本：executor-low→ haiku
高质量版本：executor-high→ opus

类似的：architect 默认是 opus，architect-low则会被解析为 sonnet，用更便宜的模型来做架构分析。

这一逻辑由getModelForAgent()解析完成：例如getModelForAgent('executor-high')返回 opus。
好处是：

调度层可以根据上下文和预算，动态选择xxx-low还是xxx。
不需要复制一份 Agent 定义，也不需要在提示词里写“现在请你稍微笨一点”。

在你自己的系统中，也可以考虑用类似的命名约定，把「成本档位」做成在线可调的开关。

六、委派强制器：别再让模型选择变成「意外之喜」

很多基于 SDK 的 Agent 系统都有一个共同的坑：
如果你在调用 Task 时没显式指定 model，系统就会悄悄继承父 Agent 的模型。

看似方便，实际非常危险——你以为子 Agent 在用 haiku 快速扫一眼，结果它继承了父级的 opus，把一个小任务算成了大戏。

6.1 pre-tool-use Hook：模型注入的「中间检查站」

为了解决这个问题，oh-my-claudecode 在 Agent 调用前加了一个「委派强制器」作为 pre-tool-use hook：

大致流程是：

拦截每一个 Task / Agent 工具调用。
判断这次调用是不是针对一个 OMC 的 Agent（通过subagent_type字段）。
如果调用里没有显式model字段：
- 根据 Agent 的定义和前面提到的getModelForAgent()解析出应该用的模型（含-low/-high）。
- 把model注入到这次调用的输入中。
如果调用显式写了model，则原样保留，不做任何修改。

这个过程有几个关键点：

只对 OMC Agent 生效：通过isAgentCall()约束，只拦截带subagent_type的调用，不会污染其他工具生态。
显式优先于隐式：开发者手动指定的模型永远优先，强制器只给「没写」的人兜底。

6.2 实战意义：从「运气」变成「制度」

有了这个强制器，系统可以保证：

executor 一定用它应该用的默认模型，除非明确要调档位。
explore 这类高频调用 Agent，永远不会意外跑在 opus 上。
所有的模型路由行为是可推理、可追踪和可控的，而不是“这次怎么感觉它突然变聪明了”。

在自己的系统里，如果你也有很多子 Agent 调用，强烈建议做类似的「模型注入中间件」，不要完全依赖框架默认行为。

七、角色边界与「委派纪律」

再强的路由与成本控制，如果每个 Agent 都「没大没小」，整个系统迟早变成一锅粥。
oh-my-claudecode 通过角色边界和提示词纪律，给关键 Agent 画得很清楚。

7.1 关键角色边界示意

下表是几个核心 Agent 的职责边界（按含义重新整理）：

Agent	类别	负责做什么	明确不做什么
architect	advisor	代码分析、架构决策、调试建议	不做需求收集、不做任务规划
analyst	planner	发现需求缺口、风险与边界	不直接分析代码、不做详细规划
planner	planner	生成任务计划和执行步骤	不做需求分析、不审查自己的计划
critic	reviewer	审查计划质量、挑问题	不做需求与代码分析
executor	specialist	按计划直接实现和改代码	不再委派、不生成子 Agent