当前位置：首页 > news >正文

一文彻底搞懂 Loop Engineering

news 2026/6/26 1:11:51

前言：AI 工程范式迎来第四代变革

2026 年 6 月，Google 工程总监 Addy Osmani 正式提出Loop Engineering（循环工程），迅速成为 AI Agent、代码自动化领域的核心架构范式。在此之前，AI 工程已经历三代演进：

Prompt Engineering（提示工程）：打磨单次对话指令，人全程手动驱动交互；
Context Engineering（上下文工程）：整合 RAG、历史记忆、工具信息，丰富单次输入上下文；
Harness Engineering（线束 / 驾驭工程）：为 Agent 搭建沙箱、权限、工具集等静态运行环境；
Loop Engineering（循环工程）：搭建自治闭环调度系统，彻底把人类从 “反复下发提示、校验结果” 的重复劳动中解放。

Anthropic Claude Code 负责人 Boris Cherny 一句话点明核心转变：

我不再手动给 Claude 写提示词。我搭建循环系统，由循环自动向模型下发指令、判断下一步动作，我的工作只剩设计循环本身。

很多开发者会混淆Agent Loop与Loop Engineering，二者并非同一概念：

Agent Loop：单个 Agent 底层最小执行单元，流程为「推理 Reason→执行 Act→观测 Observe→判断终止」，是所有智能体内置的基础逻辑；
Loop Engineering：上层系统工程方法论，批量调度、管控无数 Agent Loop，配套独立校验、事件触发、持久状态、熔断防护整套体系。简单比喻：Agent Loop 是厨师自带的做菜步骤；Loop Engineering 是全自动中央厨房调度流水线。

一、Loop Engineering 核心定义

标准定义

Loop Engineering 是一套面向 LLM Agent 的闭环系统架构方法论：开发者仅定义可量化目标、校验规则、终止条件，搭建自动调度系统，由系统自主完成任务触发、Agent 分发、执行校验、自动纠错、状态持久化全流程，无人值守持续迭代，直到满足完工标准。

核心口号：Stop Prompting. Design the Loop.（停止手动提示，专注设计循环）

核心本质

传统 AI 协作是人作为循环控制器：人发 Prompt→看结果→人工修正指令→再次提问；循环工程是系统替代人成为循环控制器，人类角色从 “实时操作员” 转变为 “系统架构师、规则定义者”。

二、完整循环工程六大核心模块（Addy Osmani 标准架构）

循一套生产级 Loop 系统由 6 个缺一不可的模块组成：

1. Automations 自动化触发器

负责自主唤醒循环，无需人工启动，主流触发源：

事件触发：Git PR 提交、Issue 新建、CI 构建失败、监控告警、数据库数据变更；
定时触发：Cron 定时任务（每日凌晨批量修复 Bug、每周生成项目报告）；
手动兜底触发：支持人工一键启动特殊任务。

2. Sub-agents 子 Agent 集群

循环的执行单元，底层复用标准 Agent Loop 完成实际任务：

多子 Agent 并行隔离执行，分工拆分复杂目标；
区分执行 Agent（写代码、爬取数据）、评审 Agent（语义校验、逻辑审查）两类角色；
每个子 Agent 独立运行原生ReAct循环。

3. Worktrees 隔离工作区

解决多 Agent 并行冲突的安全机制：

每个任务分配独立沙箱 / 代码分支，Agent 修改文件互不覆盖；
执行失败可一键销毁隔离环境，不污染主项目代码；
支持多方案并行探索，择优合并最终结果。

4. Skills 技能库

沉淀可复用工具能力，避免 Agent 每次从零探索：

文件读写、单元测试运行、编译构建、接口调用、Git 操作等标准化工具；
技能持久归档，循环每次启动直接复用，大幅降低 Token 消耗。

5. Connectors 外部连接器

打通循环与外部业务系统：GitHub、飞书 / 钉钉通知、数据库、监控平台、测试服务；配套权限管控：区分只读、可修改、需人工审批三类操作，防止越权风险。

6. State File 持久状态存储

循环的记忆中枢，解决长周期任务中断丢失进度问题：

记录迭代轮次、历史报错、中间产出、任务进度、资源消耗；
支持中断续跑、日志追溯、异常复盘；
内置熔断数据：最大迭代次数、最大 Token 成本、连续无进展阈值。

三、标准执行流程

触发唤醒：触发器捕获事件，初始化循环状态；
任务分发：拆分大目标，分配至独立 Worktree 与子 Agent；
内层执行：每个Agent 运行自身 Agent Loop完成产出；
双层校验

- 硬校验：单元测试、编译、Lint 等确定性程序校验；
- 软校验：专用评审 Agent 核查逻辑、需求匹配度；

分支决策

- 全部通过：归档成果、推送通知，循环正常结束；
- 校验失败：提取报错，生成修正指令重新迭代；
- 触发熔断：达到最大轮次 / 成本阈值，留存日志转交人工；

更新状态：保存本轮迭代信息，等待下一次触发。

四、落地适用场景

适合使用 Loop Engineering

代码自动化：PR 自动审查、批量修复 CI 报错、自动生成测试用例；
数据流水线：定时爬取、清洗校验、异常重跑、自动产出报表；
自动化运维：7×24 指标巡检、故障定位、自动修复复测；
长文本迭代：文献整理、稿件多轮修改直至满足规范。

不推荐使用

低频一次性任务，手动 Prompt 更快；
产出无量化标准、只能人工主观评判；
简单单轮问答，搭建调度系统收益极低。

五、极简 Python Demo（区分两层逻辑）

from dataclasses import dataclass, field import subprocess # 1. 循环持久状态（Loop Engineering专属） @dataclass class LoopState: goal: str iteration: int = 0 max_iter: int = 10 errors: list = field(default_factory=list) status: str = "running" # 底层：单个Agent Loop 执行单元 def agent_loop_fix_code(error: str) -> str: # LLM调用逻辑省略，输入报错返回修复代码 return "修复后代码片段" # 硬校验层（循环工程核心） def run_pytest_check(): res = subprocess.run(["pytest", "-q"], capture_output=True, text=True) return {"pass": res.returncode == 0, "msg": res.stdout + res.stderr} # 顶层：Loop Engineering 调度主循环 def loop_engine_run(goal: str): state = LoopState(goal=goal) while state.status == "running": state.iteration += 1 # 熔断判断 if state.iteration > state.max_iter: state.status = "need_human" break # 校验当前结果 check = run_pytest_check() if check["pass"]: state.status = "success" break # 失败则调用Agent Loop重跑 agent_loop_fix_code(check["msg"]) state.errors.append(check["msg"]) print(f"迭代轮次:{state.iteration}, 结果:{state.status}") if __name__ == "__main__": loop_engine_run("修复所有单元测试用例，全部通过")

代码分层说明：

agent_loop_fix_code：底层 Agent Loop；
LoopState、熔断、调度主逻辑：Loop Engineering 上层调度体系。

运行结果：

代码中的run_pytest_check()函数运行pytest -q，但当前项目没有测试文件，所以pytest总是返回失败状态，导致循环一直运行直到达到最大迭代次数（10次）。

六、区分：Loop Engineering vs 传统工作流

感觉“很像工作流”，是因为外壳相似（触发、编排、分支、状态），但内核完全相反。

传统工作流 =步骤驱动、固定流程、单向执行

循环工程 =目标驱动、动态自适应、闭环自修正

1. 传统工作流（Airflow、Dolphin、Flowable、低代码）

所有步骤开发时写死：A→B→C→D
失败只会重试当前步骤，不会改变执行方案
没有智能校验回流，流程单向不可逆
不需要AI，纯脚本即可运行

本质：流水线，按既定工序跑完即可。

2. Loop Engineering 循环工程

只定义最终目标，不定义中间步骤
Agent自主规划动作、调整方案、尝试不同思路
校验失败错误回流，重新迭代优化产出
迭代次数、路径完全动态，由结果决定

本质：研发实验室，不达验收标准不停止。

3. 核心差异对比

对比维度	传统工作流	Loop Engineering
驱动逻辑	步骤驱动，静态固定	目标驱动，动态自适应
失败处理	简单重试或终止，无优化能力	错误回流、策略迭代、自我修正
执行单元	脚本、API、固定任务	具备推理规划能力的Agent Loop
闭环能力	单向流程，无自我优化闭环	执行-校验-修正内生自治闭环