让 AI 修一个 bug,有时候它先写测试再改代码,有时候直接上手改完就提交,有时候改着改着忘了你还有 PR 模板要求。同一个需求跑三次,三次流程不一样,三次结果不一样。
这不是模型能力的问题,是缺少流程控制。
Archon 就是来解决这个问题的一个 20k 星开源项目。它不跟 AI 比谁写代码更快,而是给 AI 编程加了一套确定性的工作流引擎。作者的定义很精准:"AI coding 的 harness builder"——就像 Dockerfile 标准化了部署、GitHub Actions 标准化了 CI/CD 一样,Archon 要标准化 AI 编程的流程。
本文提纲
- AI 编程的核心问题:不确定性
- Archon 怎么解决:YAML 工作流 + DAG 执行
- 一个完整的工作流长什么样
- 17 个内置工作流:从修 bug 到架构扫描
- Git Worktree 隔离:5 个 bug 并行修不冲突
- 多平台 + Web UI
- 和 Cursor/Copilot 的区别
AI 编程的核心问题:不确定性
用 Cursor 或 Claude Code 写代码的时候,你有没有遇到过这些情况:
- 说"修这个 bug",AI 直接改代码没做调研,改完引入新 bug
- 说"加个功能",AI 没写测试就提交了
- 说"帮我 review",AI 看了代码但跳过了你团队的 PR 模板
- 同一个需求跑两遍,两次的步骤和结果完全不一样
问题的根源是:AI 编程工具只管"写",不管"怎么写"。它们没有流程意识,不知道你的团队要求先调研再计划再实现再测试再提 PR。
结果就是每次 AI 编程都像开盲盒——能力强的时候惊艳,能力弱的时候灾难。
Archon 怎么解决:YAML 工作流 + DAG 执行
Archon 的核心思路很简单:把开发流程定义成 YAML 工作流,AI 在流程的每个节点上提供智能,但流程本身是固定的。
一个工作流就是一个有向无环图(DAG)。每个节点有两种类型:
- Prompt 节点:AI 节点,由大模型填充智能(规划、生成代码、做 review)
- Bash 节点:确定性节点,执行固定命令(跑测试、lint、部署)
节点之间通过 depends_on 定义依赖关系,形成流水线。流程结构是确定性的,但每个节点的执行内容是 AI 驱动的。
这样做的好处:
| 属性 | 说明 |
|---|---|
| 可重复 | 同一个工作流,每次执行的步骤顺序都一样 |
| 可隔离 | 每次运行都有独立的 git worktree,并行不冲突 |
| 可甩手 | 启动工作流就不管了,回来看 PR |
| 可组合 | 确定性节点和 AI 节点自由混搭 |
| 可移植 | 工作流定义在 .archon/workflows/ 里,提交到仓库,团队共享 |
一个完整的工作流长什么样
看这段 YAML——从功能想法到 PR 的完整流程:
# .archon/workflows/build-feature.yaml
nodes:
- id: plan
prompt: "Explore the codebase and create an implementation plan" - id: implement
depends_on: [plan]
loop:
prompt: "Read the plan. Implement the next task. Run validation."
until: ALL_TASKS_COMPLETE
fresh_context: true - id: run-tests
depends_on: [implement]
bash: "bun run validate" - id: review
depends_on: [run-tests]
prompt: "Review all changes against the plan. Fix any issues." - id: approve
depends_on: [review]
loop:
prompt: "Present the changes for review. Address any feedback."
until: APPROVED
interactive: true - id: create-pr
depends_on: [approve]
prompt: "Push changes and create a pull request"
六个节点,流程是:规划 → 实现(循环直到全部完成)→ 跑测试 → 代码审查 → 人工审批(循环直到通过)→ 创建 PR。
注意几个关键设计:
Loop 节点:implement 节点用了 loop + until: ALL_TASKS_COMPLETE。AI 不一定一次写完所有代码,loop 让它反复迭代直到所有任务完成。每次迭代用 fresh_context: true 重新加载上下文,避免前面步骤的残留信息干扰。
Interactive 审批:approve 节点标记了 interactive: true + until: APPROVED。工作流跑到这里会暂停,等人确认后才继续。不是所有流程都能全自动——该人审的地方必须人审。
混合节点:run-tests 是 bash 节点,跑固定命令。其他都是 prompt 节点,AI 驱动。确定性检查和智能生成穿插进行。
运行效果:
You: Use archon to add dark mode to the settings pageAgent: I'll run the archon-idea-to-pr workflow for this.
→ Creating isolated worktree on branch archon/task-dark-mode...
→ Planning...
→ Implementing (task 1/4)...
→ Implementing (task 2/4)...
→ Tests failing - iterating...
→ Tests passing after 2 iterations
→ Code review complete - 0 issues
→ PR ready: https://github.com/you/project/pull/47
17 个内置工作流:从修 bug 到架构扫描
Archon 内置了 17 个工作流,覆盖了开发流程的各个环节。挑几个重点的说:
archon-idea-to-pr — 最完整的流程。功能想法 → 规划 → 实现 → 验证 → PR → 5 个并行 review agent → 自动修复。一个想法进去,一个 PR 出来。
archon-fix-github-issue — 分类问题 → 调研 → 实现 → 验证 → PR → review → 自动修复。专门处理 GitHub Issue。
archon-comprehensive-pr-review — 5 个并行 review agent 同时审查一个 PR,各自负责不同维度,最后综合结果并自动修复问题。
archon-refactor-safely — 安全重构:带类型检查钩子和行为验证。重构最怕改一个地方坏三个地方,这个工作流在每一步都验证。
archon-architect — 架构扫描:检查代码库健康度、复杂度、提出优化建议。不是改代码,是做架构级的审查。
archon-resolve-conflicts — 检测冲突 → 分析 → 解决 → 验证 → 提交。解决 merge conflict 也能自动化。
这些工作流不是死的——你可以基于内置工作流修改,也可以从零写自己的。工作流就是 YAML 文件,提交到仓库里,团队成员共享同一套流程。
Git Worktree 隔离:5 个 bug 并行修不冲突
这个设计很实用。
每次工作流运行,Archon 会自动创建一个独立的 git worktree——相当于在同一个仓库里切出一个独立的分支工作目录。不同的工作流运行之间互不干扰。
这意味着你可以同时开 5 个工作流修 5 个 bug,每个在自己的 worktree 里改代码,各自跑测试,各自提 PR。不会出现"改了 A 文件发现 B 也在改同一个文件"的冲突。
# 同时启动多个工作流
"Use archon to fix issue #42" → worktree: archon/task-fix-auth
"Use archon to fix issue #43" → worktree: archon/task-fix-cache
"Use archon to add dark mode" → worktree: archon/task-dark-mode
三个工作流并行执行,互不干扰,最后各自出一个 PR。
多平台 + Web UI
Archon 不只在终端里跑。它支持多个入口:
- CLI — 命令行直接用,和 Claude Code 配合
- Web UI — 聊天界面 + Dashboard(工作流监控)+ 拖拽式工作流编辑器
- Telegram — 5 分钟接入
- Slack — 15 分钟接入
- Discord — 5 分钟接入
- GitHub Webhooks — Issue 创建自动触发工作流
Web UI 的 Dashboard 可以看到所有平台的所有对话和工作流运行状态——在 Telegram 上启动的工作流,在 Web Dashboard 上也能追踪。拖拽式工作流编辑器让你可视化地设计 DAG,不用手写 YAML。
和 Cursor/Copilot 的区别
一句话:Cursor/Copilot 是编码工具,Archon 是流程引擎。
Cursor 帮你写代码更快,但不保证流程正确。你让 Cursor 修 bug,它可能改完就完事了,不跑测试不提 PR。Archon 不跟你比谁写代码快——它规定"修 bug 必须经过调研→实现→测试→review→PR 这几个步骤",AI 在每个步骤里提供智能,但步骤本身不能跳过。
打个比方:Cursor 是一个能力很强的程序员,但每次干活的方式不一样;Archon 是一套软件工厂的流水线,AI 是流水线上的工人。流水线保证每个产品都经过质检,工人负责具体的操作。
两者不冲突——Archon 的 AI 节点底层就是调 Claude Code、Codex 这些工具来写代码。Archon 在它们之上加了一层流程控制。
安装
30 秒快速安装:
curl -fsSL https://archon.diy/install | bash
# 或
brew install coleam00/archon/archon
前置条件:Bun、Claude Code、GitHub CLI。
完整安装(5 分钟):Clone 仓库,bun install,然后在 Claude Code 里说 "Set up Archon" 就行。
Archon 解决的问题很聚焦:AI 编程的不确定性。它不比谁的模型更强,而是让 AI 编程从"每次结果看运气"变成"流程确定、结果可控"。如果你的团队已经用 AI 编程但苦于流程混乱、质量不稳定,值得认真看看。
作者: itech001
来源: 公众号:AI人工智能时代
主页: https://www.theaiera.cn,每日分享最前沿的AI新闻和技术。
本文首发于 AI人工智能时代,转载请注明出处。
