我把这17种令人眼花缭乱的Agent架构演进,翻译成了一家小餐馆从个体户到成熟企业的完整进化史。
我把这17种令人眼花缭乱的Agent架构演进,翻译成了一家小餐馆从个体户到成熟企业的完整进化史。
最近刷到太多 Agent 的新名词了:ReAct、ToT、Blackboard、Ensemble...
是不是跟我一样,每次看到这些词都头大?
直到我把这 17 种 Agent 架构的演进,翻译成了一家小餐馆的进化史 ——
哦,原来所有的技术名词,本质上都是老板为了把店开好,一步步踩出来的坑啊!
01 个体户时代:一个人全包的起步
故事的开始,是 2018 年,老王开了家小餐馆。
刚开业的时候,店里就他一个人。
客人来了,他炒菜,炒完端菜,收完钱还要自己洗碗。
这就是最早期的单次生成 Agent:
老板一个人干所有活,没有分工,没有反馈
炒完菜直接端给客人,好不好吃全看当天手感
缺点太明显了:有时候盐放多了,有时候炒糊了,质量完全不稳定
后来老王学聪明了:炒完菜,自己先尝一口,不对就加点盐,再炒一下。
这就是 Reflection(反思)架构:
把 “炒菜” 拆成了三步:先炒个初稿,自己挑毛病,然后改
第一次有了最小的质量闭环,不用把糊菜端给客人
但问题是:尝完改完就完了,不会再回头检查改没改对,也不会跟外面的世界打交道
02 走出店门:终于能接外卖了
干了半年,老王发现,只做堂食,客人太少了。
他想:能不能给小区里的人送菜?
于是他雇了个外卖员。
这就是 Tool Use(工具使用):
老王不用自己跑了,他雇了个 “工具人”,能帮他触达店外面的世界
不用只靠自己的手艺,能把菜送到更远的地方,突破了自己的边界
但一开始,外卖员送完就完了,老王不知道客人反馈。
后来老王说:你送完问问客人,咸了淡了,回来告诉我,我下次改。
这就是 ReAct 架构:
有了 “观察 - 行动” 的循环:老王炒菜,外卖员送,客人反馈,老王根据反馈改
这就是 80% 任务的起点:大多数时候,你不需要太复杂的东西,只要能根据反馈调整,就够了
但缺点是:老王每次只看眼前的反馈,不会提前规划,比如今天要备多少菜,全靠临时想
03 有了章法:提前计划,做完先尝
店越来越大,老王忙不过来了,经常漏菜。
他想:我得提前把今天的活列出来。
于是他每天早上,先写个备菜清单:今天要做番茄炒蛋、红烧肉、清炒时蔬,按顺序来。
这就是 Planning(规划)架构:
把控制流提前写出来了,不用临时想下一步干嘛
你能看到整个计划,能检查,能改,不会漏步骤
但问题是:老王默认备菜都能成功,万一菜坏了,或者买不到,后面全乱了
后来老王雇了个帮工:每道菜做完,你先尝一口,没问题再端给客人。不对就重做。
这就是 PEV(验证驱动)架构:
把验证变成了控制流的一部分:做完菜,先验证,不对就回去重做
错误不会一直传下去,比如菜坏了,直接重新买,不会把坏菜端给客人
这时候,老王的店,终于有了靠谱的容错能力
04 分工时代:终于不用一个人干了
客人越来越多,老王一个人炒菜炒不过来了。
他雇了人:专门的厨师,专门的收银员,专门的传菜员。
这就是 Multi-Agent(多智能体)架构:
把活拆了,每个人干自己擅长的:厨师炒菜,收银员收钱,传菜员端菜
不用一个人背所有的活,角色分开了,你能单独调厨师的手艺,不用改收银员
但一开始,顺序是固定的:先炒菜,再传菜,再收钱。有时候客人要加菜,还得回头找厨师,很麻烦。
后来老王搞了个传菜板:大家都把菜放上面,谁有空谁拿,不用按顺序来。
这就是 Blackboard(黑板)架构:
有了个共享的工作台,大家都往上面写东西,谁需要谁拿
不用提前定死顺序,根据当前的状态,动态决定谁干活
再后来,客人太多了,门口乱了。
老王搞了个分诊台:客人进来,先问你吃快餐还是吃正餐,分到对应的窗口。
这就是 Meta-Controller(元控制器)架构:
入口先分个类,把客人分到最合适的地方,不用所有客人都挤一个窗口
这是生产里最常用的架构:简单,有效,不用搞太复杂的调度
还有的时候,遇到重要的客人,老王怕一个厨师做不好,就让三个厨师都做一份,然后选最好的那个。
这就是 Ensemble(集成)架构:
同一个菜,三个人做,然后选最好的,用冗余换质量
比如重要的投资建议,让三个分析师都看一遍,然后综合,避免一个人看走眼
05 记忆与试错:老板越来越会做生意了
店开久了,老王认识了好多老客人。
他记下来:张总不吃辣,李总少盐,王总每次来都要喝冰可乐。
这就是记忆系统:
老王不用每次都问客人的偏好,他记下来了,下次来直接按偏好做
有两种记忆:一种是记得发生过什么(张总上次不吃辣),一种是记得什么是真的(可乐要冰的)
后来他还搞了个关系图:张总是李总的老板,李总喜欢跟王总一起来,能做关系推理
遇到复杂的菜,比如佛跳墙,老王会试好多做法:
先试做法 1,不对,回退,试做法 2,再不对,再试做法 3
直到试出最好的那个
这就是 ToT(思维树)架构:
不是一条路走到黑,而是试好多条路,不对就回退,把推理变成了搜索
适合那种需要回溯的复杂问题,比如解谜,比如复杂的菜谱
还有的时候,老王要做新菜,他不会直接拿客人试菜。
他先拿小锅试做一下,没问题,再给客人做。
这就是 Mental Loop(心理模拟)架构:
先在自己脑子里,或者小锅里试一遍,看看会不会出问题
不用拿客人试错,降低了试错的成本
还有客人要改菜单,比如要加好多菜,老王不会直接答应。
他先算一下成本,看看能不能做,没问题,再答应客人。
这就是 Dry-Run(预演)架构:
先预演一下,看看会不会出问题,比如会不会亏本,会不会做不出来
把副作用关在闸门里,不会随便答应客人,最后做不到
06 成熟的老板:知道自己的边界,还会自我进化
店开了五年,老王越来越成熟了。
有一天,客人跟他说:老板,给我做个牛排,要西餐的那种。
老王摇摇头说:不好意思,我们不会做西餐,推荐你去隔壁的西餐厅。
这就是 Metacognitive(元认知)架构:
老王知道自己的边界:我只会做中餐,不会做西餐
不会硬着头皮答应,不会不懂装懂,直接推荐客人去合适的地方
这才是高级的能力:不是什么都能做,而是知道自己不能做什么
还有,老王每次做完菜,都会看客人的反馈。
客人说味道淡了,他就加点盐,改好再给客人,直到客人满意。
他还把好吃的菜谱记下来,下次照着做,越做越好。
这就是 Self-Improvement(自我改进)架构:
不是改一次就完了,而是一直改,直到满意
还会把好的经验存下来,下次用,越做越好
最后,老王的店越做越大,他干脆搞了个自助餐。
客人自己拿菜,自己选,不用老王管。
每个人都按自己的规则来,最后整个店的秩序自然就出来了。
这就是 Cellular Automata(元胞自动机)架构:
没有中心老板管了,每个人都是一个小单元,按自己的规则来
全局的智能,从局部的交互里涌现出来
这是最顶级的架构:不用中心控制,大家自己就能把事做好
原来所有的 Agent 架构,都是同一个故事
你看,这 17 种 Agent 架构,是不是突然就懂了?
它们根本不是什么玄乎的黑科技,就是一个老板,为了把店开好,一步步蹚出来的路:
从一个人全包,到学会自己检查
从只做堂食,到能接外卖
从临时干活,到提前计划
从一个人干,到分工合作
从记不住客人,到记得所有偏好
从不懂装懂,到知道自己的边界
从不会改,到越做越好
本质上,Agent 架构的演化,就是控制流的演化:
什么时候该停?
什么时候该继续?
什么时候该重试?
什么时候该换个人?
什么时候该拒绝?
这就是为什么,不管你用什么框架,最后都会长出这些东西 —— 因为这就是把事做好的必经之路。
最后问你个问题
你现在用的 Agent 系统,相当于老王的餐馆,进化到哪一步了?
是还在个体户炒菜的阶段?还是已经有了分工和分拣?评论区聊聊!
