Agent Loop 与 Loop Engineering 区别
摘要
2026 年,AI 编程工具链里又冒出一个新概念:Loop Engineering(循环工程)。Claude Code 负责人 Boris Cherny 说「我不再给 Claude 写 prompt,我的工作是为它写 loop」;OpenClaw 作者 Peter Steinberger 说「你不该再亲自 prompt coding agent,而该设计 loop 来 prompt 它们」。但很多人把Agent Loop和Loop Engineering混为一谈——以为在终端里敲/loop 1d就算「做 loop 工程」了。其实不是:Agent Loop是一种运行机制;Loop Engineering是围绕它展开的整套系统设计。本文厘清两者边界,并介绍开源参考库 cobusgreyling/loop-engineering 里的模式、构件与落地路径。
Loop Engineering — Design the system that prompts your agents
一、为什么需要区分这两个概念?
过去一两年,Context Engineering、Harness Engineering 相继走红。它们分别解决「单次会话里给 Agent 什么上下文」和「单次运行里 Agent 活在什么环境里」。但生产里真正难的不是「这一轮 prompt 写得好不好」,而是:
• 谁去发现待办?
• 谁决定先做哪件?
• 上一轮做到哪了?
• 改代码的和验代码的是不是同一个人?
• 出事了什么时候必须喊人?
• 这套东西每天跑会不会把 token 烧穿?
Agent Loop回答的是「怎么让它转起来」;Loop Engineering回答的是「怎么让它转得久、转得稳、转得在你睡着的时候也不闯祸」。
Addy Osmani 的概括很准:
Loop engineering is replacing yourself as the person who prompts the agent. You design the system that does it instead.
杠杆点已经从「打磨单条 prompt」移到「设计编排 Agent 的控制系统」。
二、Agent Loop 是什么?
Agent Loop是 Agent 工具里的一种递归执行原语(primitive)。
你定义一个目的,系统按固定节奏(或直到满足停止条件)反复调用 Agent:读状态 → 行动 → 写回结果 → 下一轮。Claude Code 的/loop、/schedule、/goal,Grok 的/loop [interval],GitHub Actions 的 cron,本质都是同一类东西。
cobusgreyling/loop-engineering 里的定义:
A loop is arecursive goal: define purpose, let the agent iterate (with sub-agents and external memory) until done or until the loop escalates to a human.
图 1:Agent Loop 的核心是「定时触发 → 读状态 → 执行 → 判断 → 循环或交还给人」。
Agent Loop 解决什么问题?
| 维度 | Agent Loop 提供的能力 |
|---|---|
| 持续性 | 不用你每次打开终端重新 prompt |
| 递归性 | 同一目标可多轮迭代直到「够好」 |
| 自动化 | 把「我每天早上该查 CI」变成系统行为 |
Agent Loop 的边界
仅有/loop不等于一套可上线的工程系统。一个裸 loop 往往缺:
• 分诊规则(什么该做、什么该忽略)
• 外部记忆(跨 session 的状态)
• Maker/Checker 分离(写代码的自己验自己)
• 人工闸门(高风险路径必须升级)
• 成本上限与可观测性
所以:Agent Loop 是零件;Loop Engineering 是用这些零件造一台能跑的生产机器。
三、Loop Engineering 是什么?
Loop Engineering是围绕 Agent Loop 展开的系统设计方法论——你如何发现工作、分配任务、验证结果、持久化状态,并在该交还时交还给人。
Cobus Greyling 的开源参考库 把它具象化为:模式(patterns)、启动模板(starters)、检查清单(checklist)、审计工具(loop-audit)、成本估算(loop-cost)和真实踩坑故事(stories)。
与相关概念的三层关系
参考库的 concepts 文档 把几层概念捋得很清楚:
Harness = 单次 Agent 运行的环境(工具、权限、规则)
Loop = Harness + 调度 + 状态 + 验证链
Loop Engineering = 设计并运营上述 Loop 系统的工程实践
| 概念 | 关注点 | 类比 |
|---|---|---|
| Agent Harness Engineering | 一次会话里 Agent 能用什么、知道什么 | 单个工位的工具箱 |
| Agent Loop | 让 Agent 按节奏反复跑 | 传送带的运转 |
| Loop Engineering | 整条产线如何发现任务、分工、质检、交接 | 工厂设计与 SOP |
图 2:Harness 管单次运行,Loop 管重复编排,Loop Engineering 管整套系统设计与运营。
Loop Engineering 的六大构件 + 记忆
一个能「无人值守」地跑起来的 loop,通常不是一条长 prompt,而是六个部分:
| 构件 | 在 Loop 里的职责 |
|---|---|
| Automations / Scheduling | 心跳:按 cadence 发现与分诊 |
| Worktrees | 并行执行时文件隔离,避免 merge 灾难 |
| Skills | 持久项目知识,偿还 intent debt |
| Plugins & Connectors (MCP) | 连 GitHub、Linear、Slack 等真实系统 |
| Sub-agents | Maker / Checker 分工,禁止自评 |
| + Memory / State | STATE.md等外部状态,跨 session 的脊柱 |
图 3:从调度到人工闸门的完整 Loop 流水线(来源:loop-engineering 参考库)。
Loop Engineering 还管什么?
除了「怎么转」,它还管:
- 分阶段上线:L1 只报告 → L2 小步自动修复 → L3 无人值守
- 模式选型:Daily Triage、PR Babysitter、CI Sweeper、Dependency Sweeper 等
- 安全与闸门:denylist、禁止盲目 auto-merge、MCP 权限最小化
- 成本与可观测性:
loop-budget.md、loop-run-log.md、loop-cost估算 - 多 Loop 协调:多个 loop 同时跑时的优先级与冲突处理
参考库自己就在吃自己的狗粮:用validate-patterns+auditworkflow 维护仓库,并在根目录用LOOP.md记录「这个参考库自己跑哪些 loop」。
四、核心对比:一张表看懂区别
| 维度 | Agent Loop | Loop Engineering |
|---|---|---|
| 本质 | 运行机制 / 产品功能 | 系统设计 / 工程方法论 |
| 你在做什么 | 启动一个会重复的 Agent 任务 | 设计发现→执行→验证→交接的完整系统 |
| 粒度 | 一次递归目标 + 调度 | 模式、技能、状态 schema、安全策略、成本模型 |
| 成功标准 | 「它又在跑了」 | 「它跑得对、跑得省、出事能停、人能看懂它干了什么」 |
| 典型产物 | /loop 1d ...一条命令 | STATE.md+ Skills + Worktree 策略 + Verifier + Checklist |
| 风险 | 可能空转、重复犯错、烧 token | 若设计不当,会放大错误判断;设计得当,则放大工程产能 |
再打个比方:
•Agent Loop像while (!done) { agent.run(); }—— 循环语句本身。
•Loop Engineering像写整个main():输入从哪来、状态存哪、谁写谁验、超时怎么办、日志打哪、什么时候break叫人。
五、从 Agent Loop 到 Loop Engineering:一个具体例子
假设你想「每天早上自动看 CI 挂了什么」。
只有 Agent Loop(初级阶段)
/loop 1d 检查 CI 失败,尝试修复
问题很快会出现:
• 昨天修过的 flaky test,今天又被当成新故障
• Agent 自己改、自己说「好了」
• 没有记录「哪些该忽略」(Dependabot PR、噪音告警)
• 每天早上跑满 context,月底账单难看
做了 Loop Engineering(可上线阶段)
你会补齐一整套设计:
1. 选对模式— Daily Triage,第一周L1 只报告、不自动修。
2. 写 Triage Skill— 固定输出格式:High Priority / Watch List / Noise。
3. 建 STATE.md— 每轮必读必写:
Loop State — Project X
Last run: 2026-06-11 08:15 UTC
High Priority
- #1241 — auth flow flaky test (CI red on main)
Loop action: worktree fix proposed, waiting human PR review.
Watch List
- PR #1238 open 4 days, no activity.
Recent Noise (ignored)
- Dependabot PRs
4. 分阶段放权— L1 人读报告 → L2 小修复 + 独立 Verifier 跑测试 → L3 才考虑无人 merge。
5. 加护栏—loop-budget.md日 token 上限;auth/payment 路径进 denylist;同一 PR 自动修超过 3 次就升级给人。
6. 可审计—npx @cobusgreyling/loop-audit . --suggest打出 Loop Readiness Score。
同一条/loop命令,有没有 Loop Engineering,差的是整个操作系统。
图 4:参考库建议的 L1 报告 → L2 辅助修复 → L3 无人值守分阶段路径。
六、Loop Engineering 必须正视的三笔「债」
参考库在 concepts 和 README 的 Caveats 里反复强调:
1. Intent Debt(意图债)
每个 session Agent 都是「冷启动」。团队约定、构建命令、「我们从不那样做」——若不写进 Skills /AGENTS.md,每轮 loop 都在重新猜。
2. Comprehension Debt(理解债)
Loop 越快,仓库里「你写过但没读过」的代码越多。Loop 交付了,不代表你理解了。
3. Cognitive Surrender(认知投降)
最危险的用法:把 loop 当成逃避思考的按钮。Addy Osmani 提醒:
Build the loop. But build it like someone who intends to stay the engineer, not just the person who presses go.
同一个 loop 设计,可以加速真工程师,也可以加速「只会按 Go 的人」——区别在你有没有把判断力编码进 Skills 和 Verifier。
七、怎么开始:参考库里的 5 分钟路径
cobusgreyling/loop-engineering 提供了从概念到落地的完整路径:
| 步骤 | 做什么 |
|---|---|
| 1 | 读 Substack 长文 建立概念 |
| 2 | 用 Pattern Picker 选第一个 loop |
| 3 | npx @cobusgreyling/loop-init . --pattern daily-triage脚手架 |
| 4 | npx @cobusgreyling/loop-cost估算 token |
| 5 | npx @cobusgreyling/loop-audit . --suggest查就绪分 |
| 6 | 按 Loop Design Checklist 从 L1 起步 |
六种生产模式(Daily Triage、PR Babysitter、CI Sweeper、Dependency Sweeper、Changelog Drafter、Post-Merge Cleanup)都配有 starter kit,可在 Grok、Claude Code、Codex、GitHub Actions 上对照使用。
八、结论:你下一步该升级什么?
| 如果你现在… | 说明你在… | 下一步 |
|---|---|---|
| 手动写每一轮 prompt | Harness + Prompt 阶段 | 先固化 Skills 和项目约定 |
会用/loop但无 STATE、无 Verifier | 有 Loop,无 Engineering | 补状态文件 + L1 报告模式 |
| 有分诊 Skill + STATE + Maker/Checker | Loop Engineering 入门 | 跑 audit、设 budget、扩到 L2 |
| 多 loop 并行 + 闸门 + 可观测 | Loop Engineering 成熟 | 读 failure modes、multi-loop 协调 |
Agent Loop让 AI 编程从「一次性对话」变成「可重复的自动化」。
Loop Engineering让这种自动化从「个人小技巧」变成「可审计、可交接、可规模化的工程系统」。
Boris Cherny 和 Peter Steinberger 说的其实不是「别写 prompt 了」——而是:你的高杠杆工作,已经从「写下一句话」变成了「设计下一套 loop」。
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋
📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~
