当前位置：首页 > news >正文

从 LLM 到 Agent Skill，龙虾的技术基础 · ⑦ Agent

news 2026/6/17 20:20:21

从 LLM 到 Agent Skill，龙虾的技术基础 · ⑦ Agent

本系列共 8 篇。总览：从 LLM 到 Agent Skill：我理解的 AI 应用进化路线

这篇写给谁

如果你已经完成了 Prompt、Tool、MCP 的基础建设，但系统仍然停留在“被动问答”，这篇就是关键升级点。

一句话先定性：

Agent 不是“更长 Prompt”，而是一个会规划、会执行、会纠错的闭环系统。

1）Agent 到底是什么（先把概念拉直）

工程上可以把 Agent 定义为：

围绕目标进行多步决策，并通过工具与外部世界交互，依据反馈持续修正策略，直到达成目标或触发终止条件的系统。

所以 Agent 不是单个模型，而是组合体：

模型（推理与决策）
记忆（上下文与状态）
工具（执行动作）
控制流（循环、分支、重试、终止）

2）Agent 的核心闭环：Plan -> Act -> Observe -> Reflect

一个高质量 Agent，通常按下面四步循环：

Plan（计划）：明确目标、拆解步骤；
Act（执行）：调用工具完成一步动作；
Observe（观察）：读取工具结果与环境反馈；
Reflect（反思）：判断是否达标，决定下一步（继续、重试、降级、终止）。

这个循环的本质是“边做边改”，而不是一次性把答案写完。

3）为什么 Agent 比单轮问答强，也更难

Agent 的优势

适合多步骤任务（检索、分析、执行、回写）；
能处理不完整信息（先查再答）；
能在失败后自我修正（重试/换策略）。

Agent 的代价

链路变长，故障点变多；
成本与延迟更高；
可能出现死循环、误调用、越权调用。

所以 Agent 的价值和风险是一体两面：
能力上限更高，工程纪律要求也更高。

4）Agent 的 5 种常见形态（实战视角）

结合业界常见分类与落地经验，可以粗分为：

反应式 Agent（Reactive）：基于当前输入快速响应，少规划；
工作流 Agent（Workflow-driven）：按固定流程执行，多用于企业流程自动化；
规划型 Agent（Planner）：先拆解再执行，适合复杂任务；
多 Agent 协作（Multi-agent）：角色分工协同（研究员、执行者、审计者）；
人在回路 Agent（HITL Agent）：关键步骤需人工批准。

不是越“智能”越好，关键看任务风险与可控性要求。

5）与 ReAct 的关系：为什么“思考 + 行动”是经典范式

ReAct 的核心思想是把Reasoning（推理）和Acting（行动）交错进行：

推理负责决定下一步；
行动通过工具拿到真实反馈；
反馈再反哺推理。

这比“纯思维链不落地”更稳，因为它会被外部事实持续校正。
你可以把 ReAct 看成现代 Agent 的方法论底座之一。

6）Agent 架构最容易翻车的 6 个点

目标定义模糊：不知道“完成”是什么意思。
步骤粒度失衡：一步太大不可控，太小效率低。
工具契约不清：参数、返回、错误语义混乱。
无终止条件：无限重试导致死循环。
无状态管理：每轮“失忆”，重复犯错。
无安全闸门：高风险动作直接执行。

这些问题与模型强弱关系不大，主要是系统设计问题。

7）生产级 Agent 的最小控制面

要把 Agent 真正上线，至少要有以下控制面：

1）任务控制

最大步数（max_steps）
总超时（timeout）
成本上限（token/tool budget）

2）工具控制

工具白名单
参数 schema 校验
幂等与重试策略
高风险工具审批

3）状态控制

当前步骤状态
中间结果缓存
可恢复运行状态（中断后续跑）

4）安全控制

认证与授权
审计日志
敏感动作的人在回路（HITL）

8）人在回路（HITL）：Agent 走向生产的关键闸门

很多团队把 HITL 当“体验退化”，其实它是可控自动化的核心。

推荐在这些动作前强制审批：

支付、退款、删除；
外发邮件/消息；
对外系统状态变更；
涉及隐私/合规的数据导出。

最佳实践是：

先生成执行草案 -> 人工批准 -> 再执行。

这样既保持自动化效率，也避免高风险误操作。

9）Agent 的评估方法：别只看“像不像人话”

评估 Agent 要看“任务完成质量”，而不只是文本质量。

建议至少追踪：

Task Success Rate：任务完成率；
Step Efficiency：平均步数；
Tool Accuracy：工具选择与参数准确率；
Recovery Rate：失败后恢复成功率；
Safety Violations：越权/违规动作次数；
Cost/Latency：单任务成本与端到端延迟。

同时要做回归测试：
Prompt 变更、工具变更、模型升级后，都要跑固定任务集。

10）从单 Agent 到多 Agent：什么时候该升级

不是所有问题都要多 Agent。
先用单 Agent 跑通，再考虑拆分角色。

适合多 Agent 的场景：

任务天然可分工（研究、执行、审计）；
单 Agent 上下文负担过重；
你需要强审计链路（执行与评审分离）。

不适合多 Agent 的场景：

任务简单且单步可完成；
团队监控能力不足；
成本敏感且实时性要求高。

11）一个可落地的 Agent 实施路线

阶段 1：单 Agent + 单工具流

明确目标与终止条件；
接 1~3 个高价值工具；
建立日志与回放。

阶段 2：引入规划与重试

加 Plan-Act-Observe-Reflect 循环；
增加失败分支与降级策略；
加成本/步数预算。

阶段 3：生产治理

人在回路审批；
权限与审计打通；
固定评测集回归。

阶段 4：多 Agent 协作（可选）

角色拆分（执行者、审计者等）；
统一任务总线；
增加跨 Agent 追踪与诊断。

小结

Agent 的核心价值是把“语言能力”升级为“目标导向执行能力”。
Agent 的核心挑战是可控性，而不是生成能力本身。
真正可上线的 Agent，靠的是：

闭环控制 + 工具契约 + 安全闸门 + 持续评估。

下一篇：《⑧ Agent Skill》——如何把高频 Agent 任务沉淀成可复用能力模块。

从 LLM 到 Agent Skill，龙虾的技术基础 · ⑦ Agent