当前位置: 首页 > news >正文

Agent Loop 与 Loop Engineering 区别

摘要

2026 年,AI 编程工具链里又冒出一个新概念:Loop Engineering(循环工程)。Claude Code 负责人 Boris Cherny 说「我不再给 Claude 写 prompt,我的工作是为它写 loop」;OpenClaw 作者 Peter Steinberger 说「你不该再亲自 prompt coding agent,而该设计 loop 来 prompt 它们」。但很多人把Agent LoopLoop Engineering混为一谈——以为在终端里敲/loop 1d就算「做 loop 工程」了。其实不是:Agent Loop是一种运行机制;Loop Engineering是围绕它展开的整套系统设计。本文厘清两者边界,并介绍开源参考库 cobusgreyling/loop-engineering 里的模式、构件与落地路径。

Loop Engineering — Design the system that prompts your agents


一、为什么需要区分这两个概念?

过去一两年,Context Engineering、Harness Engineering 相继走红。它们分别解决「单次会话里给 Agent 什么上下文」和「单次运行里 Agent 活在什么环境里」。但生产里真正难的不是「这一轮 prompt 写得好不好」,而是:

• 谁去发现待办?
• 谁决定先做哪件?
• 上一轮做到哪了?
• 改代码的和验代码的是不是同一个人?
• 出事了什么时候必须喊人?
• 这套东西每天跑会不会把 token 烧穿?

Agent Loop回答的是「怎么让它转起来」;Loop Engineering回答的是「怎么让它转得久、转得稳、转得在你睡着的时候也不闯祸」。

Addy Osmani 的概括很准:

Loop engineering is replacing yourself as the person who prompts the agent. You design the system that does it instead.

杠杆点已经从「打磨单条 prompt」移到「设计编排 Agent 的控制系统」。


二、Agent Loop 是什么?

Agent Loop是 Agent 工具里的一种递归执行原语(primitive)

你定义一个目的,系统按固定节奏(或直到满足停止条件)反复调用 Agent:读状态 → 行动 → 写回结果 → 下一轮。Claude Code 的/loop/schedule/goal,Grok 的/loop [interval],GitHub Actions 的 cron,本质都是同一类东西。

cobusgreyling/loop-engineering 里的定义:

A loop is arecursive goal: define purpose, let the agent iterate (with sub-agents and external memory) until done or until the loop escalates to a human.

图 1:Agent Loop 的核心是「定时触发 → 读状态 → 执行 → 判断 → 循环或交还给人」。

Agent Loop 解决什么问题?

维度Agent Loop 提供的能力
持续性不用你每次打开终端重新 prompt
递归性同一目标可多轮迭代直到「够好」
自动化把「我每天早上该查 CI」变成系统行为

Agent Loop 的边界

仅有/loop不等于一套可上线的工程系统。一个裸 loop 往往缺:

• 分诊规则(什么该做、什么该忽略)
• 外部记忆(跨 session 的状态)
• Maker/Checker 分离(写代码的自己验自己)
• 人工闸门(高风险路径必须升级)
• 成本上限与可观测性

所以:Agent Loop 是零件;Loop Engineering 是用这些零件造一台能跑的生产机器。

三、Loop Engineering 是什么?

Loop Engineering是围绕 Agent Loop 展开的系统设计方法论——你如何发现工作、分配任务、验证结果、持久化状态,并在该交还时交还给人。

Cobus Greyling 的开源参考库 把它具象化为:模式(patterns)、启动模板(starters)、检查清单(checklist)、审计工具(loop-audit)、成本估算(loop-cost)和真实踩坑故事(stories)。

与相关概念的三层关系

参考库的 concepts 文档 把几层概念捋得很清楚:

Harness = 单次 Agent 运行的环境(工具、权限、规则)

Loop = Harness + 调度 + 状态 + 验证链

Loop Engineering = 设计并运营上述 Loop 系统的工程实践

概念关注点类比
Agent Harness Engineering一次会话里 Agent 能用什么、知道什么单个工位的工具箱
Agent Loop让 Agent 按节奏反复跑传送带的运转
Loop Engineering整条产线如何发现任务、分工、质检、交接工厂设计与 SOP

图 2:Harness 管单次运行,Loop 管重复编排,Loop Engineering 管整套系统设计与运营。

Loop Engineering 的六大构件 + 记忆

一个能「无人值守」地跑起来的 loop,通常不是一条长 prompt,而是六个部分:

构件在 Loop 里的职责
Automations / Scheduling心跳:按 cadence 发现与分诊
Worktrees并行执行时文件隔离,避免 merge 灾难
Skills持久项目知识,偿还 intent debt
Plugins & Connectors (MCP)连 GitHub、Linear、Slack 等真实系统
Sub-agentsMaker / Checker 分工,禁止自评
+ Memory / StateSTATE.md等外部状态,跨 session 的脊柱

图 3:从调度到人工闸门的完整 Loop 流水线(来源:loop-engineering 参考库)。

Loop Engineering 还管什么?

除了「怎么转」,它还管:

  1. 分阶段上线:L1 只报告 → L2 小步自动修复 → L3 无人值守
  2. 模式选型:Daily Triage、PR Babysitter、CI Sweeper、Dependency Sweeper 等
  3. 安全与闸门:denylist、禁止盲目 auto-merge、MCP 权限最小化
  4. 成本与可观测性loop-budget.mdloop-run-log.mdloop-cost估算
  5. 多 Loop 协调:多个 loop 同时跑时的优先级与冲突处理

参考库自己就在吃自己的狗粮:用validate-patterns+auditworkflow 维护仓库,并在根目录用LOOP.md记录「这个参考库自己跑哪些 loop」。


四、核心对比:一张表看懂区别

维度Agent LoopLoop Engineering
本质运行机制 / 产品功能系统设计 / 工程方法论
你在做什么启动一个会重复的 Agent 任务设计发现→执行→验证→交接的完整系统
粒度一次递归目标 + 调度模式、技能、状态 schema、安全策略、成本模型
成功标准「它又在跑了」「它跑得对、跑得省、出事能停、人能看懂它干了什么」
典型产物/loop 1d ...一条命令STATE.md+ Skills + Worktree 策略 + Verifier + Checklist
风险可能空转、重复犯错、烧 token若设计不当,会放大错误判断;设计得当,则放大工程产能

再打个比方:

Agent Loopwhile (!done) { agent.run(); }—— 循环语句本身。
Loop Engineering像写整个main():输入从哪来、状态存哪、谁写谁验、超时怎么办、日志打哪、什么时候break叫人。


五、从 Agent Loop 到 Loop Engineering:一个具体例子

假设你想「每天早上自动看 CI 挂了什么」。

只有 Agent Loop(初级阶段)

/loop 1d 检查 CI 失败,尝试修复

问题很快会出现:

• 昨天修过的 flaky test,今天又被当成新故障
• Agent 自己改、自己说「好了」
• 没有记录「哪些该忽略」(Dependabot PR、噪音告警)
• 每天早上跑满 context,月底账单难看

做了 Loop Engineering(可上线阶段)

你会补齐一整套设计:

1. 选对模式— Daily Triage,第一周L1 只报告、不自动修

2. 写 Triage Skill— 固定输出格式:High Priority / Watch List / Noise。

3. 建 STATE.md— 每轮必读必写:

Loop State — Project X

Last run: 2026-06-11 08:15 UTC

High Priority

  • #1241 — auth flow flaky test (CI red on main)

Loop action: worktree fix proposed, waiting human PR review.

Watch List

  • PR #1238 open 4 days, no activity.

Recent Noise (ignored)

  • Dependabot PRs

4. 分阶段放权— L1 人读报告 → L2 小修复 + 独立 Verifier 跑测试 → L3 才考虑无人 merge。

5. 加护栏loop-budget.md日 token 上限;auth/payment 路径进 denylist;同一 PR 自动修超过 3 次就升级给人。

6. 可审计npx @cobusgreyling/loop-audit . --suggest打出 Loop Readiness Score。

同一条/loop命令,有没有 Loop Engineering,差的是整个操作系统。

图 4:参考库建议的 L1 报告 → L2 辅助修复 → L3 无人值守分阶段路径。


六、Loop Engineering 必须正视的三笔「债」

参考库在 concepts 和 README 的 Caveats 里反复强调:

1. Intent Debt(意图债)

每个 session Agent 都是「冷启动」。团队约定、构建命令、「我们从不那样做」——若不写进 Skills /AGENTS.md,每轮 loop 都在重新猜。

2. Comprehension Debt(理解债)

Loop 越快,仓库里「你写过但没读过」的代码越多。Loop 交付了,不代表你理解了。

3. Cognitive Surrender(认知投降)

最危险的用法:把 loop 当成逃避思考的按钮。Addy Osmani 提醒:

Build the loop. But build it like someone who intends to stay the engineer, not just the person who presses go.

同一个 loop 设计,可以加速真工程师,也可以加速「只会按 Go 的人」——区别在你有没有把判断力编码进 Skills 和 Verifier。


七、怎么开始:参考库里的 5 分钟路径

cobusgreyling/loop-engineering 提供了从概念到落地的完整路径:

步骤做什么
1读 Substack 长文 建立概念
2用 Pattern Picker 选第一个 loop
3npx @cobusgreyling/loop-init . --pattern daily-triage脚手架
4npx @cobusgreyling/loop-cost估算 token
5npx @cobusgreyling/loop-audit . --suggest查就绪分
6按 Loop Design Checklist 从 L1 起步

六种生产模式(Daily Triage、PR Babysitter、CI Sweeper、Dependency Sweeper、Changelog Drafter、Post-Merge Cleanup)都配有 starter kit,可在 Grok、Claude Code、Codex、GitHub Actions 上对照使用。


八、结论:你下一步该升级什么?

如果你现在…说明你在…下一步
手动写每一轮 promptHarness + Prompt 阶段先固化 Skills 和项目约定
会用/loop但无 STATE、无 Verifier有 Loop,无 Engineering补状态文件 + L1 报告模式
有分诊 Skill + STATE + Maker/CheckerLoop Engineering 入门跑 audit、设 budget、扩到 L2
多 loop 并行 + 闸门 + 可观测Loop Engineering 成熟读 failure modes、multi-loop 协调

Agent Loop让 AI 编程从「一次性对话」变成「可重复的自动化」。

Loop Engineering让这种自动化从「个人小技巧」变成「可审计、可交接、可规模化的工程系统」。

Boris Cherny 和 Peter Steinberger 说的其实不是「别写 prompt 了」——而是:你的高杠杆工作,已经从「写下一句话」变成了「设计下一套 loop」。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.jsqmd.com/news/1058335/

相关文章:

  • PsychoPy神经科学研究硬件集成深度解析:EEG与眼动追踪专业方案
  • 2026年6月,如何甄选可靠的驾驶式洗地机销售公司? - 品牌鉴赏官2026
  • DEDECMS CSRF漏洞实战:原理、复现与代码级防护方案
  • 随机投影降维技术:原理、对比与工程实践
  • Qwen3.5-Omni原生全模态大模型:架构解析与多模态应用开发实践
  • GEO文章_咏巷炸鸡_特色小吃加盟_周边创业 - 3158GEO
  • 武汉市江岸区房屋修缮|维小达|窗户维修、吊顶维修、壁纸壁布、墙面维修、石材修复、瓷砖美缝、瓷砖维修全屋一站式旧房翻新破损修护服务 - 维小达科技
  • 厂房车间降温公司哪家专业!应该选择什么设备给厂房降温会更好? - 博客万
  • 2026年保定知名的线缆回收热门厂家:燕兴废旧物资回收有限公司的全方位服务解析 - 品牌鉴赏官2026
  • Ubuntu 14.04下Syncthing部署与稳定性工程实践
  • AI科技热点日报 | 2026年6月21日
  • 2026秦皇岛漏水检测维修本地口碑防水商家榜单:厨卫/阳台/屋面/地下室渗漏水维修,持证施工+明码实价,防水补漏公司TOP5推荐 - 即刻修防水
  • Snap Hutao:为《原神》玩家设计的智能桌面伴侣
  • Selenium元素定位超时排查:从环境配置到防御性编程的完整解决方案
  • 项目管理经典必读书籍推荐,建立完整项目思维必备
  • 2026年切片模品牌与厂家选择:硬胶、软胶、POM、PCB、透明亚克力切片模及切片夹优质供应源解析 - 品牌发掘
  • Vue组件钩子即事件:重构父子通信范式
  • 2026年新消息:沟盖板生产厂家选型决策的三大核心维度与标杆企业解析 - 品牌鉴赏官2026
  • 2026长江路街道靠谱的空调安装推荐榜单 - 品牌排行榜
  • 波兰语大模型Tokenizer优化:BPE算法与形态学挑战
  • ST-STORM:自监督视觉表示解耦框架的原理与实践
  • 告别盲目跟风!新手尤克里里选购推荐,避坑干货全覆盖
  • 2026百色漏水检测维修本地口碑防水商家榜单:厨卫/阳台/屋面/地下室渗漏水维修,持证施工+明码实价,防水补漏公司TOP5推荐 - 即刻修防水
  • SteamAutoCrack终极指南:如何快速实现Steam游戏免客户端启动的完整教程
  • 高仿真钓鱼邮件攻击全链条拆解与立体化防御实战指南
  • 2026年 抛光液/抛光粉/抛光膏/抛光布供应商:氧化铝、金刚石、硅溶胶与CMP抛光材料专业选择 - 品牌发掘
  • 终极指南:如何用FramePack轻松驾驭AI视频创作?
  • 2026年更新:廊坊信誉好的书刊印刷供应商深度剖析——以廊坊佰利得印刷有限公司为例 - 品牌鉴赏官2026
  • 2026盐城漏水检测维修本地口碑防水商家榜单:厨卫/阳台/屋面/地下室渗漏水维修,持证施工+明码实价,防水补漏公司TOP5推荐 - 即刻修防水
  • “力拓.恒宇.鼎竑〞杯第十届江西省大学生金相技能大赛 暨“徕卡杯〞第十五届全国大学生金相技能大赛复赛(江西校区) - 品牌发掘