当前位置: 首页 > news >正文

AI 写代码每次结果都不一样?Archon 用 YAML 工作流把 AI 编程变成流水线

让 AI 修一个 bug,有时候它先写测试再改代码,有时候直接上手改完就提交,有时候改着改着忘了你还有 PR 模板要求。同一个需求跑三次,三次流程不一样,三次结果不一样。

这不是模型能力的问题,是缺少流程控制

Archon 就是来解决这个问题的一个 20k 星开源项目。它不跟 AI 比谁写代码更快,而是给 AI 编程加了一套确定性的工作流引擎。作者的定义很精准:"AI coding 的 harness builder"——就像 Dockerfile 标准化了部署、GitHub Actions 标准化了 CI/CD 一样,Archon 要标准化 AI 编程的流程。

本文提纲

  1. AI 编程的核心问题:不确定性
  2. Archon 怎么解决:YAML 工作流 + DAG 执行
  3. 一个完整的工作流长什么样
  4. 17 个内置工作流:从修 bug 到架构扫描
  5. Git Worktree 隔离:5 个 bug 并行修不冲突
  6. 多平台 + Web UI
  7. 和 Cursor/Copilot 的区别

AI 编程的核心问题:不确定性

用 Cursor 或 Claude Code 写代码的时候,你有没有遇到过这些情况:

  • 说"修这个 bug",AI 直接改代码没做调研,改完引入新 bug
  • 说"加个功能",AI 没写测试就提交了
  • 说"帮我 review",AI 看了代码但跳过了你团队的 PR 模板
  • 同一个需求跑两遍,两次的步骤和结果完全不一样

问题的根源是:AI 编程工具只管"写",不管"怎么写"。它们没有流程意识,不知道你的团队要求先调研再计划再实现再测试再提 PR。

结果就是每次 AI 编程都像开盲盒——能力强的时候惊艳,能力弱的时候灾难。

Archon 怎么解决:YAML 工作流 + DAG 执行

Archon 的核心思路很简单:把开发流程定义成 YAML 工作流,AI 在流程的每个节点上提供智能,但流程本身是固定的。

一个工作流就是一个有向无环图(DAG)。每个节点有两种类型:

  • Prompt 节点:AI 节点,由大模型填充智能(规划、生成代码、做 review)
  • Bash 节点:确定性节点,执行固定命令(跑测试、lint、部署)

节点之间通过 depends_on 定义依赖关系,形成流水线。流程结构是确定性的,但每个节点的执行内容是 AI 驱动的。

这样做的好处:

属性 说明
可重复 同一个工作流,每次执行的步骤顺序都一样
可隔离 每次运行都有独立的 git worktree,并行不冲突
可甩手 启动工作流就不管了,回来看 PR
可组合 确定性节点和 AI 节点自由混搭
可移植 工作流定义在 .archon/workflows/ 里,提交到仓库,团队共享

一个完整的工作流长什么样

看这段 YAML——从功能想法到 PR 的完整流程:

# .archon/workflows/build-feature.yaml
nodes:
  - id: plan
    prompt: "Explore the codebase and create an implementation plan"  - id: implement
    depends_on: [plan]
    loop:
      prompt: "Read the plan. Implement the next task. Run validation."
      until: ALL_TASKS_COMPLETE
      fresh_context: true  - id: run-tests
    depends_on: [implement]
    bash: "bun run validate"  - id: review
    depends_on: [run-tests]
    prompt: "Review all changes against the plan. Fix any issues."  - id: approve
    depends_on: [review]
    loop:
      prompt: "Present the changes for review. Address any feedback."
      until: APPROVED
      interactive: true  - id: create-pr
    depends_on: [approve]
    prompt: "Push changes and create a pull request"

六个节点,流程是:规划 → 实现(循环直到全部完成)→ 跑测试 → 代码审查 → 人工审批(循环直到通过)→ 创建 PR。

注意几个关键设计:

Loop 节点implement 节点用了 loop + until: ALL_TASKS_COMPLETE。AI 不一定一次写完所有代码,loop 让它反复迭代直到所有任务完成。每次迭代用 fresh_context: true 重新加载上下文,避免前面步骤的残留信息干扰。

Interactive 审批approve 节点标记了 interactive: true + until: APPROVED。工作流跑到这里会暂停,等人确认后才继续。不是所有流程都能全自动——该人审的地方必须人审。

混合节点run-tests 是 bash 节点,跑固定命令。其他都是 prompt 节点,AI 驱动。确定性检查和智能生成穿插进行。

运行效果:

You: Use archon to add dark mode to the settings pageAgent: I'll run the archon-idea-to-pr workflow for this.
       → Creating isolated worktree on branch archon/task-dark-mode...
       → Planning...
       → Implementing (task 1/4)...
       → Implementing (task 2/4)...
       → Tests failing - iterating...
       → Tests passing after 2 iterations
       → Code review complete - 0 issues
       → PR ready: https://github.com/you/project/pull/47

17 个内置工作流:从修 bug 到架构扫描

Archon 内置了 17 个工作流,覆盖了开发流程的各个环节。挑几个重点的说:

archon-idea-to-pr — 最完整的流程。功能想法 → 规划 → 实现 → 验证 → PR → 5 个并行 review agent → 自动修复。一个想法进去,一个 PR 出来。

archon-fix-github-issue — 分类问题 → 调研 → 实现 → 验证 → PR → review → 自动修复。专门处理 GitHub Issue。

archon-comprehensive-pr-review — 5 个并行 review agent 同时审查一个 PR,各自负责不同维度,最后综合结果并自动修复问题。

archon-refactor-safely — 安全重构:带类型检查钩子和行为验证。重构最怕改一个地方坏三个地方,这个工作流在每一步都验证。

archon-architect — 架构扫描:检查代码库健康度、复杂度、提出优化建议。不是改代码,是做架构级的审查。

archon-resolve-conflicts — 检测冲突 → 分析 → 解决 → 验证 → 提交。解决 merge conflict 也能自动化。

这些工作流不是死的——你可以基于内置工作流修改,也可以从零写自己的。工作流就是 YAML 文件,提交到仓库里,团队成员共享同一套流程。

Git Worktree 隔离:5 个 bug 并行修不冲突

这个设计很实用。

每次工作流运行,Archon 会自动创建一个独立的 git worktree——相当于在同一个仓库里切出一个独立的分支工作目录。不同的工作流运行之间互不干扰。

这意味着你可以同时开 5 个工作流修 5 个 bug,每个在自己的 worktree 里改代码,各自跑测试,各自提 PR。不会出现"改了 A 文件发现 B 也在改同一个文件"的冲突。

# 同时启动多个工作流
"Use archon to fix issue #42"     worktree: archon/task-fix-auth
"Use archon to fix issue #43"     worktree: archon/task-fix-cache
"Use archon to add dark mode"     worktree: archon/task-dark-mode

三个工作流并行执行,互不干扰,最后各自出一个 PR。

多平台 + Web UI

Archon 不只在终端里跑。它支持多个入口:

  • CLI — 命令行直接用,和 Claude Code 配合
  • Web UI — 聊天界面 + Dashboard(工作流监控)+ 拖拽式工作流编辑器
  • Telegram — 5 分钟接入
  • Slack — 15 分钟接入
  • Discord — 5 分钟接入
  • GitHub Webhooks — Issue 创建自动触发工作流

Web UI 的 Dashboard 可以看到所有平台的所有对话和工作流运行状态——在 Telegram 上启动的工作流,在 Web Dashboard 上也能追踪。拖拽式工作流编辑器让你可视化地设计 DAG,不用手写 YAML。

和 Cursor/Copilot 的区别

一句话:Cursor/Copilot 是编码工具,Archon 是流程引擎。

Cursor 帮你写代码更快,但不保证流程正确。你让 Cursor 修 bug,它可能改完就完事了,不跑测试不提 PR。Archon 不跟你比谁写代码快——它规定"修 bug 必须经过调研→实现→测试→review→PR 这几个步骤",AI 在每个步骤里提供智能,但步骤本身不能跳过。

打个比方:Cursor 是一个能力很强的程序员,但每次干活的方式不一样;Archon 是一套软件工厂的流水线,AI 是流水线上的工人。流水线保证每个产品都经过质检,工人负责具体的操作。

两者不冲突——Archon 的 AI 节点底层就是调 Claude Code、Codex 这些工具来写代码。Archon 在它们之上加了一层流程控制。

安装

30 秒快速安装:

curl -fsSL https://archon.diy/install | bash
# 或
brew install coleam00/archon/archon

前置条件:Bun、Claude Code、GitHub CLI。

完整安装(5 分钟):Clone 仓库,bun install,然后在 Claude Code 里说 "Set up Archon" 就行。


Archon 解决的问题很聚焦:AI 编程的不确定性。它不比谁的模型更强,而是让 AI 编程从"每次结果看运气"变成"流程确定、结果可控"。如果你的团队已经用 AI 编程但苦于流程混乱、质量不稳定,值得认真看看。


作者: itech001
来源: 公众号:AI人工智能时代
主页: https://www.theaiera.cn,每日分享最前沿的AI新闻和技术。

本文首发于 AI人工智能时代,转载请注明出处。

http://www.jsqmd.com/news/729753/

相关文章:

  • Android开发者的‘黑匣子’:手把手教你用ChkBugReport高效分析bugreport文件
  • 避开这些坑!用Simulink搭建导弹模型时,大气、自动驾驶仪与导引头模块的配置要点
  • Gophish钓鱼平台从入门到“封神”:我的邮件服务器搭建与高送达率配置全记录
  • 开源项目精选指南:从Awesome列表到高效技术选型
  • KEIL Map文件实战:如何从内存分布图揪出栈溢出元凶(附排查流程图)
  • STM32驱动VS1053B解码芯片播放MP3:从SPI通信到FATFS文件系统的保姆级教程
  • 从一道BUUCTF的SSRF题,聊聊Linux命令行那些意想不到的“副作用”
  • 开源AI知识库Tome:基于大语言模型与向量数据库的智能笔记系统
  • JasperGold Deep Bug Hunting保姆级配置指南:九大策略(Cycle/Bound/State Swarm等)怎么选?
  • 基于OpenClaw框架构建飞书自动化交付机器人:打通GitLab/Jenkins工作流
  • ARM SVE2指令集:SQINCH与SQINCW的饱和运算原理与应用
  • 从Composer install失败到生产就绪:PHP 9.0异步插件安装避坑清单(含SSL证书校验绕过方案、ZTS兼容性修复补丁)
  • 如何用3个步骤将Markdown笔记快速转换为交互式思维导图:终极可视化指南
  • 煤矿刮板输送机链条断裂预警【附代码】
  • 告别数据丢失!深入Aurora IP核NFC流控:从帧格式解析到Verilog状态机实现
  • 高性能硬字幕提取架构解析:基于GPU加速的实时OCR技术实现
  • 2026年气泡膜厂家选购推荐:从参数到供应的全维度解析 - 优质品牌商家
  • EV-DO Rev.A系统容量建模与网络优化实践
  • 别再死记硬背OpenPose原理了!用‘飞镖盘’和‘连连看’帮你彻底搞懂PAF与关键点匹配
  • 别再瞎用i和p了!SAP ABAP数据类型避坑指南:财务、报表、性能场景怎么选?
  • 热膨胀合金推荐哪家?2026年热膨胀合金厂商联系方式 - 品牌2026
  • Kiwi-Edit:自然语言驱动的智能视频编辑技术解析
  • 告别轮询!在UE5 C++中手把手教你用WebSocket实现实时聊天(附Node.js服务端代码)
  • ReFIne框架:大模型数学推理的可解释性解决方案
  • 2026年消防培训多少钱:消防培训央国企消防员在哪里培训/消防培训学校哪家正规/消防培训学校哪家通过率高/消防培训学校哪家靠谱/选择指南 - 优质品牌商家
  • APP开始上架拼多多--
  • 别再手动建分区了!PostgreSQL 12+ 用这个触发器函数自动按月分区
  • 保姆级教程:在YOLOv8中一键切换IoU损失函数(CIoU, DIoU, SIoU, EIoU, Focal-EIoU)
  • Virtuoso Layout L 查找 / 替换(Find/Replace) 的对象筛选条件总表
  • 船舶柴油机活塞-缸套磨损故障诊断【附代码】