当前位置：首页 > news >正文

降成本+控质量：团队级AI编程多模型协同落地路径

news 2026/6/30 4:18:02

如果团队正在高频使用 AI 编程工具，很容易进入一个误区：把所有研发任务都交给同一个“最强模型”来完成——从需求理解、代码生成，到调试、测试甚至自我审查。

这种方式在个人使用或低频场景下看似高效，但在团队规模化落地时，会迅速暴露出三个问题：

成本错配，简单的重命名、样板代码、测试补齐等任务仍然调用高成本模型，造成持续浪费；
质量不可控，模型既负责“写代码”又负责“审代码”，缺少独立验证机制，容易把隐性错误带入代码库；
工程体系缺失，没有任务边界、权限隔离和客观评测，AI 编程行为难以审计、回滚和持续优化。

因此，团队级 AI 编程的关键不在于“选一个最强模型”。优刻得技术团队推出一套可运行的工程体系：通过Agent路由分工+独立审查机制+客观验证流程+最小权限治理+多模型协同评估，让不同模型在合适的位置做合适的事。

一、整体架构：把AI编程拆成四类Agent

多模型协同的重点不是“多开几个 Agent”，而是拆清楚职责边界。推荐拆成 4 类：

架构图：

flowchart TD A[用户需求]--> B[主编排 Agent]B--> C{任务分类与风险判断}C-->|需求澄清 / 架构设计| D[规划 Agent\n只读 / 禁 bash]C-->|跨文件实现 / 调试| E[执行 Agent\n可写 / bash 受控]C-->|低风险机械任务| F[批量 Agent\n可写 / 禁 bash]D--> BF--> G[审查 Agent\n独立上下文 / 只读]E--> GG--> H{客观验证}H-->|失败| EH-->|通过| I{风险等级}I-->|低风险| J[常规 Review]I-->|中风险| K[自动验证 + 代码审查]I-->|高风险| L[自动验证 + 人工重点审查 + 必要时灰度]

二、核心步骤：用OpenCode配一套可落地流程

下面用 OpenCode 做参考。配置字段、权限写法和模型 ID 需要以团队实际使用版本和官方文档为准。

1. 两种配置方式

OpenCode 的 Agent 配置通常可以有两类组织方式。

方式一：Markdown 文件

把每个 Agent 写成独立 .md 文件，放入：

项目级：.opencode/agents/
用户级：~/.config/opencode/agents/

文件头部用 frontmatter 声明 mode、model、permission 等元数据，正文写系统提示词。

优点：提示词和配置在同一个文件里，适合版本管理和独立审查。

方式二：opencode.json 集中配置

在项目根目录用 opencode.json 集中声明 Agent。

{"$schema":"https://opencode.ai/config.json","agent":{"build":{"mode":"primary","model":"<provider>/<model>","prompt":"{file:./prompts/build.txt}","permission":{"edit":"allow","bash":"allow"}},"code-reviewer":{"mode":"subagent","model":"<provider>/<model>","permission":{"edit":"deny"}}}}

原文说明：早期版本使用 tools 字段控制工具开关，自 v1.1.1 起 deprecated，统一改用 permission。这个点建议接入前再以 OpenCode 官方文档或具体版本发布说明复核。

另外，OpenCode 启动时加载一次配置，运行中的会话不会热重载。修改 opencode.json 或 Agent 文件后，需要退出并重启。

如果希望编排 Agent 成为默认入口，可以在 opencode.json 中设置：

{"default_agent":"orchestrator"}

该字段应指向一个非隐藏的 primary 模式 Agent。用户也可以通过 Tab 在 primary Agent 之间切换。

2. 主编排 Agent

主编排 Agent 只做需求拆解、任务路由、结果汇总和验收控制，不直接改代码。

--- description: 主编排。拆解需求、调用规划 Agent、派发实现与审查任务、控制返工与验收。默认不直接修改代码。 mode: primary model: <provider>/<orchestrator-model> permission: read: allow glob: allow grep: allow edit: deny bash: deny webfetch: deny websearch: deny lsp: deny todowrite: allow task: "*": deny "architect": allow "executor": allow "reviewer": allow "bulk": allow

主编排 Agent 的提示词可以这样写：

你是编排者，职责严格限定为：需求拆解、任务路由、汇总子 Agent 结果、控制返工与验收。 绝对禁止： - 禁止自行产出代码实现、补丁、命令脚本。 - 禁止自行产出审查结论或最终技术方案。 - 禁止自行回答本应由子 Agent 完成的工作。 - 禁止编辑文件、执行 bash、联网搜索。 你必须做且只做以下动作： 1. 读取需求与上下文，明确目标、边界、验收标准和风险等级。 2. 复杂任务调用 architect。 3. 实现任务调用 executor。 4. 低风险机械任务调用 bulk。 5. 每次代码修改后调用 reviewer 在独立上下文中审查和验证。 6. 若验证失败，返回 executor 修复，不要自己改。 7. 只根据 reviewer 的客观验证结果和风险等级做验收判断。

需要注意：task 白名单只约束模型自动调用子 Agent，不阻止用户手动调用。用户仍然可能通过 @executor 直接唤起子 Agent，从而绕过编排和审查。

如果想降低绕过风险，可以将核心子 Agent 设置为 hidden: true，让它们不出现在 @ 自动补全中，只能由编排 Agent 通过 Task 工具程序化调用。hidden 只影响用户侧可见性，不影响 Agent 本身可用性。

3. 规划 Agent

规划 Agent 只读代码库，负责产出决策完整的方案。

--- description: 规划与架构。当需要需求澄清、方案设计、接口划分、数据流设计、测试矩阵或验收标准时使用。只读代码库，产出决策完整的方案，不修改代码。 mode: subagent model: <provider>/<high-reasoning-model> permission: read: allow glob: allow grep: allow edit: deny bash: deny webfetch: deny websearch: deny

规划 Agent 的输出至少包括：

模块划分。
接口变化。
数据流。
错误处理边界。
测试矩阵。
验收标准。

它不写实现代码，也不修改文件。

4. 执行 Agent

执行 Agent 根据既定方案修改代码，并运行项目规定的验证命令。

--- description: 实现与执行。当需要跨文件修改、调试、构建、运行测试或修复返工时使用。根据既定方案完成代码修改，运行项目规定的验证命令。 mode: subagent model: <provider>/<execution-model> permission: read: allow glob: allow grep: allow edit: allow bash: ask

执行 Agent 返回内容必须包括：

修改摘要。
影响文件。
运行命令。
测试结果。
未解决风险。

5. 审查 Agent

审查 Agent 只读 diff，运行验证命令，只报告阻塞性问题。

--- description: 审查与验证。当需要读取 diff、运行验证命令、发现阻塞问题或判断是否返工时使用。只读 diff，运行项目规定的验证命令，只报告阻塞性问题，不修改代码。 mode: subagent model: <provider>/<review-model> permission: read: allow glob: allow grep: allow edit: deny bash: "*": deny "git status*": allow "git diff*": allow "git show*": allow "git log*": allow "npm test*": allow "pnpm test*": allow "yarn test*": allow "go test*": allow "pytest*": allow "mvn test*": allow "gradle test*": allow "make test*": allow "npm run lint*": allow "npm run typecheck*": allow "tsc*": allow

审查 Agent 的提示词重点：

你负责在独立上下文中审查代码。只报告阻塞性问题。 必须读取 diff，并尽可能运行项目声明的验证命令。 不修改代码，不提出无关风格建议。 返回内容必须包括： - 验证命令 - 执行结果 - 阻塞问题 - 是否建议返工

阻塞性问题包括：

功能错误。
安全漏洞。
数据损坏风险。
并发问题。
兼容性破坏。
测试失败。
类型错误或编译错误。

风格问题交给 formatter、lint 和代码规范，不要让审查 Agent 在无关细节上消耗上下文。

6. 批量 Agent

批量 Agent 只处理明确、低风险、机械性的修改。

--- description: 廉价批量。当需要变量重命名、样板代码、测试补齐等低风险机械任务时使用。处理明确、机械性的修改，遇复杂问题停止并交回编排者。 mode: subagent model: <provider>/<low-cost-model> permission: read: allow glob: allow grep: allow edit: allow bash: deny

适合它的任务：