如果你用过 ChatGPT 或 Claude的话对标准聊天机器人的工作方式应该不陌生:提问然后得到一个回答。但如果交给它一个多步骤任务呢?比如:“帮我找到最便宜航班,查询我的常旅客积分,并预订最佳选项”。
这时标准聊天机器人就会卡住,因为它没有在单次响应之后继续推进的机制。
智能体循环架构(agentic loop architecture)就是为了解决这一局限而出现的。下面这篇介绍会说明它是什么、如何工作,以及如何把它实现出来。
简单聊天机器人与 AI 智能体的区别
聊天机器人以单次通过(single pass)的方式运行他的交互流程是:用户发送消息,LLM 生成响应,流程结束。一次输入对应一次输出,没有任何记忆或状态被带入下一步。
智能体则是被设计用来行动(act),而不只是响应。两者之间的差异,可以归结为一个非常基础的编程概念
while
循环。
智能体循环是一种迭代循环:LLM 在其中使用工具、根据反馈做出调整,并反复执行这一过程,直到任务彻底完成。
智能体循环的 5 个阶段
智能体循环一般跨越五个阶段。
- 感知(Perceive):智能体接收输入,可能是用户的 Prompt、某个 API 的响应,或是一条错误消息。
- 推理(Reason):LLM 处理这段上下文,决定下一步该做什么。
- 规划(Plan):面对复杂目标时,智能体会把目标拆解为更小的子任务。
- 行动(Act):智能体执行具体动作——运行代码、查询数据库或调用 API。
- 观察(Observe):智能体查看动作的结果,判断它是否生效,或者计划是否需要调整。
在多数任务中,核心执行循环可以进一步简化为持续迭代的三步:推理 → 行动 → 观察。
智能体循环的核心迭代
架构 / 流程图
下面是这一架构的简单可视化示意:
详细的智能体循环架构
https://avoid.overfit.cn/post/ecdc7d58222c4632830c8ee9352c8f88
