当前位置：首页 > news >正文

我把这17种令人眼花缭乱的Agent架构演进，翻译成了一家小餐馆从个体户到成熟企业的完整进化史。

news 2026/5/5 17:32:25

我把这17种令人眼花缭乱的Agent架构演进，翻译成了一家小餐馆从个体户到成熟企业的完整进化史。

最近刷到太多 Agent 的新名词了：ReAct、ToT、Blackboard、Ensemble...

是不是跟我一样，每次看到这些词都头大？

直到我把这 17 种 Agent 架构的演进，翻译成了一家小餐馆的进化史 ——

哦，原来所有的技术名词，本质上都是老板为了把店开好，一步步踩出来的坑啊！

01 个体户时代：一个人全包的起步

故事的开始，是 2018 年，老王开了家小餐馆。

刚开业的时候，店里就他一个人。

客人来了，他炒菜，炒完端菜，收完钱还要自己洗碗。

这就是最早期的单次生成 Agent：

老板一个人干所有活，没有分工，没有反馈
炒完菜直接端给客人，好不好吃全看当天手感
缺点太明显了：有时候盐放多了，有时候炒糊了，质量完全不稳定

后来老王学聪明了：炒完菜，自己先尝一口，不对就加点盐，再炒一下。

这就是 Reflection（反思）架构：

把 “炒菜” 拆成了三步：先炒个初稿，自己挑毛病，然后改
第一次有了最小的质量闭环，不用把糊菜端给客人
但问题是：尝完改完就完了，不会再回头检查改没改对，也不会跟外面的世界打交道

02 走出店门：终于能接外卖了

干了半年，老王发现，只做堂食，客人太少了。

他想：能不能给小区里的人送菜？

于是他雇了个外卖员。

这就是 Tool Use（工具使用）：

老王不用自己跑了，他雇了个 “工具人”，能帮他触达店外面的世界
不用只靠自己的手艺，能把菜送到更远的地方，突破了自己的边界

但一开始，外卖员送完就完了，老王不知道客人反馈。

后来老王说：你送完问问客人，咸了淡了，回来告诉我，我下次改。

这就是 ReAct 架构：

有了 “观察 - 行动” 的循环：老王炒菜，外卖员送，客人反馈，老王根据反馈改
这就是 80% 任务的起点：大多数时候，你不需要太复杂的东西，只要能根据反馈调整，就够了
但缺点是：老王每次只看眼前的反馈，不会提前规划，比如今天要备多少菜，全靠临时想

03 有了章法：提前计划，做完先尝

店越来越大，老王忙不过来了，经常漏菜。

他想：我得提前把今天的活列出来。

于是他每天早上，先写个备菜清单：今天要做番茄炒蛋、红烧肉、清炒时蔬，按顺序来。

这就是 Planning（规划）架构：

把控制流提前写出来了，不用临时想下一步干嘛
你能看到整个计划，能检查，能改，不会漏步骤
但问题是：老王默认备菜都能成功，万一菜坏了，或者买不到，后面全乱了

后来老王雇了个帮工：每道菜做完，你先尝一口，没问题再端给客人。不对就重做。

这就是 PEV（验证驱动）架构：

把验证变成了控制流的一部分：做完菜，先验证，不对就回去重做
错误不会一直传下去，比如菜坏了，直接重新买，不会把坏菜端给客人
这时候，老王的店，终于有了靠谱的容错能力

04 分工时代：终于不用一个人干了

客人越来越多，老王一个人炒菜炒不过来了。

他雇了人：专门的厨师，专门的收银员，专门的传菜员。

这就是 Multi-Agent（多智能体）架构：

把活拆了，每个人干自己擅长的：厨师炒菜，收银员收钱，传菜员端菜
不用一个人背所有的活，角色分开了，你能单独调厨师的手艺，不用改收银员

但一开始，顺序是固定的：先炒菜，再传菜，再收钱。有时候客人要加菜，还得回头找厨师，很麻烦。

后来老王搞了个传菜板：大家都把菜放上面，谁有空谁拿，不用按顺序来。

这就是 Blackboard（黑板）架构：

有了个共享的工作台，大家都往上面写东西，谁需要谁拿
不用提前定死顺序，根据当前的状态，动态决定谁干活

再后来，客人太多了，门口乱了。

老王搞了个分诊台：客人进来，先问你吃快餐还是吃正餐，分到对应的窗口。

这就是 Meta-Controller（元控制器）架构：

入口先分个类，把客人分到最合适的地方，不用所有客人都挤一个窗口
这是生产里最常用的架构：简单，有效，不用搞太复杂的调度

还有的时候，遇到重要的客人，老王怕一个厨师做不好，就让三个厨师都做一份，然后选最好的那个。

这就是 Ensemble（集成）架构：

同一个菜，三个人做，然后选最好的，用冗余换质量
比如重要的投资建议，让三个分析师都看一遍，然后综合，避免一个人看走眼

05 记忆与试错：老板越来越会做生意了

店开久了，老王认识了好多老客人。

他记下来：张总不吃辣，李总少盐，王总每次来都要喝冰可乐。

这就是记忆系统：

老王不用每次都问客人的偏好，他记下来了，下次来直接按偏好做
有两种记忆：一种是记得发生过什么（张总上次不吃辣），一种是记得什么是真的（可乐要冰的）
后来他还搞了个关系图：张总是李总的老板，李总喜欢跟王总一起来，能做关系推理

遇到复杂的菜，比如佛跳墙，老王会试好多做法：

先试做法 1，不对，回退，试做法 2，再不对，再试做法 3
直到试出最好的那个

这就是 ToT（思维树）架构：

不是一条路走到黑，而是试好多条路，不对就回退，把推理变成了搜索
适合那种需要回溯的复杂问题，比如解谜，比如复杂的菜谱

还有的时候，老王要做新菜，他不会直接拿客人试菜。

他先拿小锅试做一下，没问题，再给客人做。

这就是 Mental Loop（心理模拟）架构：

先在自己脑子里，或者小锅里试一遍，看看会不会出问题
不用拿客人试错，降低了试错的成本

还有客人要改菜单，比如要加好多菜，老王不会直接答应。

他先算一下成本，看看能不能做，没问题，再答应客人。

这就是 Dry-Run（预演）架构：

先预演一下，看看会不会出问题，比如会不会亏本，会不会做不出来
把副作用关在闸门里，不会随便答应客人，最后做不到

06 成熟的老板：知道自己的边界，还会自我进化

店开了五年，老王越来越成熟了。

有一天，客人跟他说：老板，给我做个牛排，要西餐的那种。

老王摇摇头说：不好意思，我们不会做西餐，推荐你去隔壁的西餐厅。

这就是 Metacognitive（元认知）架构：

老王知道自己的边界：我只会做中餐，不会做西餐
不会硬着头皮答应，不会不懂装懂，直接推荐客人去合适的地方
这才是高级的能力：不是什么都能做，而是知道自己不能做什么

还有，老王每次做完菜，都会看客人的反馈。

客人说味道淡了，他就加点盐，改好再给客人，直到客人满意。

他还把好吃的菜谱记下来，下次照着做，越做越好。

这就是 Self-Improvement（自我改进）架构：

不是改一次就完了，而是一直改，直到满意
还会把好的经验存下来，下次用，越做越好

最后，老王的店越做越大，他干脆搞了个自助餐。

客人自己拿菜，自己选，不用老王管。

每个人都按自己的规则来，最后整个店的秩序自然就出来了。

这就是 Cellular Automata（元胞自动机）架构：

没有中心老板管了，每个人都是一个小单元，按自己的规则来
全局的智能，从局部的交互里涌现出来
这是最顶级的架构：不用中心控制，大家自己就能把事做好

原来所有的 Agent 架构，都是同一个故事

你看，这 17 种 Agent 架构，是不是突然就懂了？

它们根本不是什么玄乎的黑科技，就是一个老板，为了把店开好，一步步蹚出来的路：

从一个人全包，到学会自己检查
从只做堂食，到能接外卖
从临时干活，到提前计划
从一个人干，到分工合作
从记不住客人，到记得所有偏好
从不懂装懂，到知道自己的边界
从不会改，到越做越好

本质上，Agent 架构的演化，就是控制流的演化：

什么时候该停？
什么时候该继续？
什么时候该重试？
什么时候该换个人？
什么时候该拒绝？

这就是为什么，不管你用什么框架，最后都会长出这些东西 —— 因为这就是把事做好的必经之路。

最后问你个问题

你现在用的 Agent 系统，相当于老王的餐馆，进化到哪一步了？

是还在个体户炒菜的阶段？还是已经有了分工和分拣？评论区聊聊！

查看全文

http://www.jsqmd.com/news/758501/

UE5项目内存爆了别慌！手把手教你用UE4 Memory Report和Size Map揪出‘内存刺客’

Leader五一销售开门红：懒人洗家族霸榜双料TOP1，多品类高增长读懂年轻生活 - 速递信息

PyCharm社区版2024.3安装配置全攻略：从Python环境到必备插件，一次搞定

终极Maple Mono编程字体指南：打造完美代码显示体验

保姆级教程：在银河麒麟V10上搞定网页桌面快捷方式与自定义图标（附火狐/奇安信浏览器配置）

别再折腾Hyper-V虚拟交换机了！用内部网络+共享搞定WiFi下虚拟机上网（保姆级避坑）

山西安居搬家：太原靠谱的搬家搬迁公司推荐几家 - LYL仔仔

ACP科普：什么是挣值（Earned Value）

NS-USBLoader实战指南：专业级Switch游戏管理与企业级文件传输解决方案

Dify RAG流程卡顿？用这6行Python脚本自动捕获chunk embedding耗时瓶颈

思源宋体完全指南：免费商用开源字体快速上手与实战应用

广州品冠装饰设计：花都专业的室内装修公司选哪家 - LYL仔仔

3步掌握Stream-Translator：让你的外语直播瞬间变成中文

电脑里重复图片太多？5个简单步骤彻底清理图片库

AI写论文高效之选！4款AI论文生成神器，轻松完成论文任务

青海省 CPPM 和 SCMP 报考新选择（众智商学院）联系方式 - 众智商学院课程中心

从MVC到MVD：拆解Qt与Vue的视图模型，聊聊桌面端与Web前端的设计哲学差异

东莞市百鑫资源再生利用：东莞市电缆电线回收电话 - LYL仔仔

深入S32K3 RTD工程结构：从启动代码到链接脚本，手把手解析多核MCU的软件骨架

SAGE：基于执行反馈的自适应数据生成技术解析

终极指南：WSABuilds让Windows 10/11完美运行Android应用

从Windows到Ubuntu：手把手教你为RoboCup仿真救援项目搭建双系统开发环境（避坑指南）

当所有VC的Usage Limit加起来不到100%：PCIe 6.0协议里一个悬而未决的‘漏洞’

初次使用taotoken模型广场进行模型选型与测试的流程体验

L4级智能体家电入驻珠峰！海尔Seeker套系挑战4276米极限 - 速递信息

HiveWE：魔兽争霸III地图编辑的现代化解决方案

别再傻傻用Set统计UV了！用Redis HyperLogLog，12KB内存搞定千万级用户去重

别再手动算CRC了！用Verilog在FPGA上实现Modbus CRC校验的保姆级教程（附完整代码）

大语言模型合规评估：策略推理轨迹技术解析

警惕！图文并茂的“深度伪造”新闻更难辨？聊聊多模态伪造检测的现状与挑战

相关文章：