当前位置：首页 > news >正文

从 ReAct 到 Planning：从走一步看一步到先拆解再推进

news 2026/6/30 6:17:37

如果说 ReAct 解决的是“大模型如何边思考边行动”，那么 Planning 解决的就是：当任务变长、步骤变多、约束变复杂时，很多 Agent 不再直接进入执行，而是会先做任务拆解，再决定如何推进。

在学完 ReAct 之后，很多人会自然产生一个新的疑问：

这篇文章要回答的核心问题就是：当任务复杂到一定程度时，为什么很多 Agent 不再满足于“走一步看一步”，而会先做任务拆解，再进入执行阶段。

ReAct 的核心是：读当前上下文 -> 判断下一步该做什么 -> 调工具或继续思考 -> 根据新结果进入下一轮。它更像一种“边走边想”的推进方式。

Planning 的核心是：在真正执行前 -> 先把目标拆成若干步骤或子任务 -> 给后续执行提供一个相对稳定的路线图。它更像一种“先想清楚大致路径，再开始动手”的方式。

最短区别ReAct：更关注“当前这一步该做什么”。Planning：更关注“整个任务大致应该怎么拆、怎么走”。

ReAct 很强，但它有一个天然特点：它每一轮都更关注“眼前下一步”，而不是“整个任务全局结构”。这在简单任务里完全没问题。但一旦任务开始变复杂，就容易出现几个问题：

容易只顾眼前，不顾全局模型可能会当场找到一个能做的动作就先做，但根本没有先考虑整体路径是否合理。
容易重复、绕路当缺乏整体计划时，模型可能会重复搜索、重复调用相近工具，或者在多个子问题之间来回无意义地切换。
长任务里容易丢失结构感如果一个任务本来包含多个阶段，纯靠局部循环推进，模型很容易在中途失去对“当前到底做到第几步”的清晰把握，就像在深层的代码调用栈里迷失了方向。
很难提前暴露任务分解对于人类或系统来说，有时候最想知道的不是“模型现在在干嘛”，而是：它准备怎么做？它打算分成几步？每一步想解决什么问题？这时就需要 Planning。

多阶段任务例如：写一份深度的技术调研报告、做一轮微服务架构的源码分析、排查一个复杂的线上服务器 OOM 异常。这些任务天然不是一步就能完成的。
包含多个子问题的任务例如：“帮我比较 5 个消息队列框架的优缺点，并结合高并发场景给出选型建议”，或者“先分析需求，再查资料，再输出方案”。这里不是单次工具调用的问题，而是任务拆解问题。
有明显前后依赖关系的任务例如：先收集信息 -> 再筛选信息 -> 再总结 -> 最后生成结论。如果前后顺序绝对重要，Planning 的价值就会直线上升。
需要更强可解释性的任务有些时候你希望系统先把计划列出来给人看。这样一来，人可以提前校正方向，系统执行过程更可审计，后续如果中断也更容易恢复和接管。

最简单的 Planning模型在动作前，会先输出类似这样的文本内容：

更工程化的 Planning在真实 Agent 系统里，Planning 往往会映射成具体的数据结构，表现为：

也正因为如此，很多走向工程化的 LangGraph 项目里，会开始频繁出现plan、steps、task_queue这类状态（State）字段。

最容易误解的是：有了 Planning，是不是就不用 ReAct 了？答案通常不是。Planning 和 ReAct 往往不是替代关系，而是不同层级的能力。

一种常见组合方式：

比如：先规划出“查资料 -> 提炼重点 -> 写总结”。然后在“查资料”这一步内部，模型仍然可以用 ReAct 的方式去高频地搜索和筛选信息。

总结：Planning 解决“先分几步做”，ReAct 解决“当前这一步怎么做”。

很多人会把这两者混为一谈。区分它们其实很简单：

也就是说，Planning 不一定意味着流程已经硬编码在代码里了；Workflow 也不一定要求模型先产出一个文本计划。两者可以完美结合，但绝不是一回事。

总结：Planning 更关注任务拆解本身，Workflow 更关注执行骨架和流程控制。

更有全局感：模型不再只盯着“眼前这一步”，而是先建立整体路线图。
更适合复杂任务：任务越长、阶段越多，Planning 防跑偏的价值越明显。
更容易解释和审查：先把计划列出来，人类和系统都更容易判断大方向是否合理。
更利于和其他机制结合：有了计划清单，就极其方便接入 Human-in-the-loop（人类审批）、Workflow 节点跳转，或者进行多 Agent 协同分工。

不要把它当成所有场景的银弹，它也有明显的代价：

先规划本身有成本：多一次模型调用，就多一层 Token 消耗、多一层状态和逻辑维护。
计划不一定靠谱：模型给出的计划也可能会漏步骤、顺序不合理，或者拆得太粗/太细。
过度规划会拖慢简单任务：有些任务本来一句话就能答，硬套 Planning 框架反而白白浪费时间。
计划和执行可能脱节：即使计划看起来天衣无缝，在执行中仍可能因为外部结果的变化而必须推翻重来。就像你一开始规划好了游戏地图的渲染和寻路逻辑，但在实际编写时，突然发现水域底下的物理映射逻辑行不通（比如水区其实不该有路径），这时候你就必须中途打破原定计划，动态修改路线。