一文彻底搞懂 Loop Engineering
前言:AI 工程范式迎来第四代变革
2026 年 6 月,Google 工程总监 Addy Osmani 正式提出Loop Engineering(循环工程),迅速成为 AI Agent、代码自动化领域的核心架构范式。 在此之前,AI 工程已经历三代演进:
- Prompt Engineering(提示工程):打磨单次对话指令,人全程手动驱动交互;
- Context Engineering(上下文工程):整合 RAG、历史记忆、工具信息,丰富单次输入上下文;
- Harness Engineering(线束 / 驾驭工程):为 Agent 搭建沙箱、权限、工具集等静态运行环境;
- Loop Engineering(循环工程):搭建自治闭环调度系统,彻底把人类从 “反复下发提示、校验结果” 的重复劳动中解放。
Anthropic Claude Code 负责人 Boris Cherny 一句话点明核心转变:
我不再手动给 Claude 写提示词。我搭建循环系统,由循环自动向模型下发指令、判断下一步动作,我的工作只剩设计循环本身。
很多开发者会混淆Agent Loop与Loop Engineering,二者并非同一概念:
- Agent Loop:单个 Agent 底层最小执行单元,流程为「推理 Reason→执行 Act→观测 Observe→判断终止」,是所有智能体内置的基础逻辑;
- Loop Engineering:上层系统工程方法论,批量调度、管控无数 Agent Loop,配套独立校验、事件触发、持久状态、熔断防护整套体系。 简单比喻:Agent Loop 是厨师自带的做菜步骤;Loop Engineering 是全自动中央厨房调度流水线。
一、Loop Engineering 核心定义
标准定义
Loop Engineering 是一套面向 LLM Agent 的闭环系统架构方法论:开发者仅定义可量化目标、校验规则、终止条件,搭建自动调度系统,由系统自主完成任务触发、Agent 分发、执行校验、自动纠错、状态持久化全流程,无人值守持续迭代,直到满足完工标准。
核心口号:Stop Prompting. Design the Loop.(停止手动提示,专注设计循环)
核心本质
传统 AI 协作是人作为循环控制器:人发 Prompt→看结果→人工修正指令→再次提问; 循环工程是系统替代人成为循环控制器,人类角色从 “实时操作员” 转变为 “系统架构师、规则定义者”。
二、完整循环工程六大核心模块(Addy Osmani 标准架构)
循一套生产级 Loop 系统由 6 个缺一不可的模块组成:
1. Automations 自动化触发器
负责自主唤醒循环,无需人工启动,主流触发源:
- 事件触发:Git PR 提交、Issue 新建、CI 构建失败、监控告警、数据库数据变更;
- 定时触发:Cron 定时任务(每日凌晨批量修复 Bug、每周生成项目报告);
- 手动兜底触发:支持人工一键启动特殊任务。
2. Sub-agents 子 Agent 集群
循环的执行单元,底层复用标准 Agent Loop 完成实际任务:
- 多子 Agent 并行隔离执行,分工拆分复杂目标;
- 区分执行 Agent(写代码、爬取数据)、评审 Agent(语义校验、逻辑审查)两类角色;
- 每个子 Agent 独立运行原生
ReAct循环。
3. Worktrees 隔离工作区
解决多 Agent 并行冲突的安全机制:
- 每个任务分配独立沙箱 / 代码分支,Agent 修改文件互不覆盖;
- 执行失败可一键销毁隔离环境,不污染主项目代码;
- 支持多方案并行探索,择优合并最终结果。
4. Skills 技能库
沉淀可复用工具能力,避免 Agent 每次从零探索:
- 文件读写、单元测试运行、编译构建、接口调用、Git 操作等标准化工具;
- 技能持久归档,循环每次启动直接复用,大幅降低 Token 消耗。
5. Connectors 外部连接器
打通循环与外部业务系统:GitHub、飞书 / 钉钉通知、数据库、监控平台、测试服务; 配套权限管控:区分只读、可修改、需人工审批三类操作,防止越权风险。
6. State File 持久状态存储
循环的记忆中枢,解决长周期任务中断丢失进度问题:
- 记录迭代轮次、历史报错、中间产出、任务进度、资源消耗;
- 支持中断续跑、日志追溯、异常复盘;
- 内置熔断数据:最大迭代次数、最大 Token 成本、连续无进展阈值。
三、标准执行流程
- 触发唤醒:触发器捕获事件,初始化循环状态;
- 任务分发:拆分大目标,分配至独立 Worktree 与子 Agent;
- 内层执行:每个Agent 运行自身 Agent Loop完成产出;
- 双层校验
- 硬校验:单元测试、编译、Lint 等确定性程序校验;
- 软校验:专用评审 Agent 核查逻辑、需求匹配度;
- 分支决策
- 全部通过:归档成果、推送通知,循环正常结束;
- 校验失败:提取报错,生成修正指令重新迭代;
- 触发熔断:达到最大轮次 / 成本阈值,留存日志转交人工;
- 更新状态:保存本轮迭代信息,等待下一次触发。
四、落地适用场景
适合使用 Loop Engineering
- 代码自动化:PR 自动审查、批量修复 CI 报错、自动生成测试用例;
- 数据流水线:定时爬取、清洗校验、异常重跑、自动产出报表;
- 自动化运维:7×24 指标巡检、故障定位、自动修复复测;
- 长文本迭代:文献整理、稿件多轮修改直至满足规范。
不推荐使用
- 低频一次性任务,手动 Prompt 更快;
- 产出无量化标准、只能人工主观评判;
- 简单单轮问答,搭建调度系统收益极低。
五、极简 Python Demo(区分两层逻辑)
from dataclasses import dataclass, field import subprocess # 1. 循环持久状态(Loop Engineering专属) @dataclass class LoopState: goal: str iteration: int = 0 max_iter: int = 10 errors: list = field(default_factory=list) status: str = "running" # 底层:单个Agent Loop 执行单元 def agent_loop_fix_code(error: str) -> str: # LLM调用逻辑省略,输入报错返回修复代码 return "修复后代码片段" # 硬校验层(循环工程核心) def run_pytest_check(): res = subprocess.run(["pytest", "-q"], capture_output=True, text=True) return {"pass": res.returncode == 0, "msg": res.stdout + res.stderr} # 顶层:Loop Engineering 调度主循环 def loop_engine_run(goal: str): state = LoopState(goal=goal) while state.status == "running": state.iteration += 1 # 熔断判断 if state.iteration > state.max_iter: state.status = "need_human" break # 校验当前结果 check = run_pytest_check() if check["pass"]: state.status = "success" break # 失败则调用Agent Loop重跑 agent_loop_fix_code(check["msg"]) state.errors.append(check["msg"]) print(f"迭代轮次:{state.iteration}, 结果:{state.status}") if __name__ == "__main__": loop_engine_run("修复所有单元测试用例,全部通过")代码分层说明:
agent_loop_fix_code:底层 Agent Loop;LoopState、熔断、调度主逻辑:Loop Engineering 上层调度体系。
运行结果:
代码中的run_pytest_check()函数运行pytest -q,但当前项目没有测试文件,所以pytest总是返回失败状态,导致循环一直运行直到达到最大迭代次数(10次)。
六、区分:Loop Engineering vs 传统工作流
感觉“很像工作流”,是因为外壳相似(触发、编排、分支、状态),但内核完全相反。
传统工作流 =步骤驱动、固定流程、单向执行
循环工程 =目标驱动、动态自适应、闭环自修正
1. 传统工作流(Airflow、Dolphin、Flowable、低代码)
- 所有步骤开发时写死:A→B→C→D
- 失败只会重试当前步骤,不会改变执行方案
- 没有智能校验回流,流程单向不可逆
- 不需要AI,纯脚本即可运行
本质:流水线,按既定工序跑完即可。
2. Loop Engineering 循环工程
- 只定义最终目标,不定义中间步骤
- Agent自主规划动作、调整方案、尝试不同思路
- 校验失败错误回流,重新迭代优化产出
- 迭代次数、路径完全动态,由结果决定
本质:研发实验室,不达验收标准不停止。
3. 核心差异对比
对比维度 | 传统工作流 | Loop Engineering |
驱动逻辑 | 步骤驱动,静态固定 | 目标驱动,动态自适应 |
失败处理 | 简单重试或终止,无优化能力 | 错误回流、策略迭代、自我修正 |
执行单元 | 脚本、API、固定任务 | 具备推理规划能力的Agent Loop |
闭环能力 | 单向流程,无自我优化闭环 | 执行-校验-修正 内生自治闭环 |
七、 极简上手:终端/AI工具快速使用
主流AI编码工具(Claude Code等)原生支持循环工程能力,无需复杂部署,一键启用:
- 开启定时循环:
/loop 5m 自动化检查项目代码规范、修复简易报错,固定周期持续巡检迭代; - 开启目标自治循环:直接下发量化Goal,例如
/goal 将项目单元测试覆盖率提升至80%,最大迭代10轮,系统自动循环优化直至达标; - 终止循环:无需等待结束,手动兜底指令
/goal clear,一键停止当前所有循环任务。
感兴趣的宝子可以关注一波,后续会更新更多有用的知识!!!
