当前位置: 首页 > news >正文

从 LLM 到 Agent Skill,龙虾的技术基础 · ⑦ Agent

从 LLM 到 Agent Skill,龙虾的技术基础 · ⑦ Agent

本系列共 8 篇。总览:从 LLM 到 Agent Skill:我理解的 AI 应用进化路线


这篇写给谁

如果你已经完成了 Prompt、Tool、MCP 的基础建设,但系统仍然停留在“被动问答”,这篇就是关键升级点。

一句话先定性:

Agent 不是“更长 Prompt”,而是一个会规划、会执行、会纠错的闭环系统。


1)Agent 到底是什么(先把概念拉直)

工程上可以把 Agent 定义为:

围绕目标进行多步决策,并通过工具与外部世界交互,依据反馈持续修正策略,直到达成目标或触发终止条件的系统。

所以 Agent 不是单个模型,而是组合体:

  • 模型(推理与决策)
  • 记忆(上下文与状态)
  • 工具(执行动作)
  • 控制流(循环、分支、重试、终止)

2)Agent 的核心闭环:Plan -> Act -> Observe -> Reflect

一个高质量 Agent,通常按下面四步循环:

  1. Plan(计划):明确目标、拆解步骤;
  2. Act(执行):调用工具完成一步动作;
  3. Observe(观察):读取工具结果与环境反馈;
  4. Reflect(反思):判断是否达标,决定下一步(继续、重试、降级、终止)。

这个循环的本质是“边做边改”,而不是一次性把答案写完。


3)为什么 Agent 比单轮问答强,也更难

Agent 的优势

  • 适合多步骤任务(检索、分析、执行、回写);
  • 能处理不完整信息(先查再答);
  • 能在失败后自我修正(重试/换策略)。

Agent 的代价

  • 链路变长,故障点变多;
  • 成本与延迟更高;
  • 可能出现死循环、误调用、越权调用。

所以 Agent 的价值和风险是一体两面:
能力上限更高,工程纪律要求也更高。


4)Agent 的 5 种常见形态(实战视角)

结合业界常见分类与落地经验,可以粗分为:

  1. 反应式 Agent(Reactive):基于当前输入快速响应,少规划;
  2. 工作流 Agent(Workflow-driven):按固定流程执行,多用于企业流程自动化;
  3. 规划型 Agent(Planner):先拆解再执行,适合复杂任务;
  4. 多 Agent 协作(Multi-agent):角色分工协同(研究员、执行者、审计者);
  5. 人在回路 Agent(HITL Agent):关键步骤需人工批准。

不是越“智能”越好,关键看任务风险与可控性要求。


5)与 ReAct 的关系:为什么“思考 + 行动”是经典范式

ReAct 的核心思想是把Reasoning(推理)Acting(行动)交错进行:

  • 推理负责决定下一步;
  • 行动通过工具拿到真实反馈;
  • 反馈再反哺推理。

这比“纯思维链不落地”更稳,因为它会被外部事实持续校正。
你可以把 ReAct 看成现代 Agent 的方法论底座之一。


6)Agent 架构最容易翻车的 6 个点

  1. 目标定义模糊:不知道“完成”是什么意思。
  2. 步骤粒度失衡:一步太大不可控,太小效率低。
  3. 工具契约不清:参数、返回、错误语义混乱。
  4. 无终止条件:无限重试导致死循环。
  5. 无状态管理:每轮“失忆”,重复犯错。
  6. 无安全闸门:高风险动作直接执行。

这些问题与模型强弱关系不大,主要是系统设计问题。


7)生产级 Agent 的最小控制面

要把 Agent 真正上线,至少要有以下控制面:

1)任务控制

  • 最大步数(max_steps)
  • 总超时(timeout)
  • 成本上限(token/tool budget)

2)工具控制

  • 工具白名单
  • 参数 schema 校验
  • 幂等与重试策略
  • 高风险工具审批

3)状态控制

  • 当前步骤状态
  • 中间结果缓存
  • 可恢复运行状态(中断后续跑)

4)安全控制

  • 认证与授权
  • 审计日志
  • 敏感动作的人在回路(HITL)

8)人在回路(HITL):Agent 走向生产的关键闸门

很多团队把 HITL 当“体验退化”,其实它是可控自动化的核心。

推荐在这些动作前强制审批:

  • 支付、退款、删除;
  • 外发邮件/消息;
  • 对外系统状态变更;
  • 涉及隐私/合规的数据导出。

最佳实践是:

先生成执行草案 -> 人工批准 -> 再执行。

这样既保持自动化效率,也避免高风险误操作。


9)Agent 的评估方法:别只看“像不像人话”

评估 Agent 要看“任务完成质量”,而不只是文本质量。

建议至少追踪:

  • Task Success Rate:任务完成率;
  • Step Efficiency:平均步数;
  • Tool Accuracy:工具选择与参数准确率;
  • Recovery Rate:失败后恢复成功率;
  • Safety Violations:越权/违规动作次数;
  • Cost/Latency:单任务成本与端到端延迟。

同时要做回归测试:
Prompt 变更、工具变更、模型升级后,都要跑固定任务集。


10)从单 Agent 到多 Agent:什么时候该升级

不是所有问题都要多 Agent。
先用单 Agent 跑通,再考虑拆分角色。

适合多 Agent 的场景:

  • 任务天然可分工(研究、执行、审计);
  • 单 Agent 上下文负担过重;
  • 你需要强审计链路(执行与评审分离)。

不适合多 Agent 的场景:

  • 任务简单且单步可完成;
  • 团队监控能力不足;
  • 成本敏感且实时性要求高。

11)一个可落地的 Agent 实施路线

阶段 1:单 Agent + 单工具流

  • 明确目标与终止条件;
  • 接 1~3 个高价值工具;
  • 建立日志与回放。

阶段 2:引入规划与重试

  • 加 Plan-Act-Observe-Reflect 循环;
  • 增加失败分支与降级策略;
  • 加成本/步数预算。

阶段 3:生产治理

  • 人在回路审批;
  • 权限与审计打通;
  • 固定评测集回归。

阶段 4:多 Agent 协作(可选)

  • 角色拆分(执行者、审计者等);
  • 统一任务总线;
  • 增加跨 Agent 追踪与诊断。

小结

  • Agent 的核心价值是把“语言能力”升级为“目标导向执行能力”。
  • Agent 的核心挑战是可控性,而不是生成能力本身。
  • 真正可上线的 Agent,靠的是:

闭环控制 + 工具契约 + 安全闸门 + 持续评估。

下一篇:《⑧ Agent Skill》——如何把高频 Agent 任务沉淀成可复用能力模块。


延伸阅读

  • 视频(Agent 类型与应用):5 Types of AI Agents: Autonomous Functions & Real-World Applications
  • ReAct 方法介绍(Google):ReAct: Synergizing Reasoning and Acting in Language Models
  • ReAct 项目页:ReAct official page
  • OpenAI Agents SDK(Guardrails):Guardrails
  • OpenAI Agents SDK(HITL):Human-in-the-loop

系列:龙虾的技术基础 ⑦/8

http://www.jsqmd.com/news/600836/

相关文章:

  • 忍者像素绘卷新手入门:无需绘画基础,用Z-Image-Turbo生成专属忍者绘卷
  • 【Vue2-ElementUI】:model、v-model、prop
  • 雪女-斗罗大陆-造相Z-Turbo场景应用:为小说配图、做社交头像
  • Phi-3-Mini-128K效果实测:128K长上下文代码分析与摘要生成
  • OpenClaw技能开发入门:为千问3.5-27B定制专属自动化模块
  • C++高性能编程问答:Phi-3-mini解答内存管理与STL疑难
  • Wan2.2-I2V-A14B在Web开发中的应用:前端上传图片实时生成GIF
  • Graphormer模型训练与调参指南:PyCharm专业开发环境配置
  • OpenClaw未来展望:Qwen3-4B模型与自动化生态的演进方向
  • 从加法器到CPU:手把手教你用Verilog HDL在头歌平台搭建一个简单的8位CPU
  • 【RAG】【vector_stores007】异步索引创建示例
  • 我业余时间开发的产品,被 LangChain 官方推荐了!
  • 数据库(如MySQL)的锁实现细节
  • Qwen3-TTS低延迟实战:集成WebRTC实现实时语音通话,无缝对话
  • FireRed-OCR Studio部署教程:Windows WSL2环境下GPU加速配置
  • MiniCPM-o-4.5-nvidia-FlagOS学术写作助手:LaTeX公式与论文排版智能辅助
  • Leather Dress Collection 自动化运维脚本生成:根据自然语言描述创建Shell或Python脚本
  • Qwen3-ASR-0.6B乡村振兴:乡村广播语音内容自动摘要系统
  • AudioSeal Pixel Studio入门指南:CUDA设备检测+临时缓存一键清理功能详解
  • 深夜爆肝剪片遇日语“天书”?我靠这个翻译神器,效率直接翻倍!
  • CSS如何快速调整全站主题颜色_利用全局CSS变量的一键修改特性
  • 2025届最火的六大AI学术工具解析与推荐
  • 随机链表的复制
  • TurboDiffusion实战案例:从文案到视频,完整创作流程分享
  • ShardingSphere分片算法配置和雪花算法的高可用变种实现细节
  • 告别复杂配置!GLM-4.7-Flash镜像开箱即用,支持OpenAI兼容API
  • Ostrakon-VL像素终端实战:餐饮后厨食材库存图像盘点案例
  • DAMOYOLO-S开发入门:JavaScript前端实现实时视频检测与可视化
  • 从 LLM 到 Agent Skill,龙虾的技术基础 · ⑧ Agent Skill
  • LCD1602液晶显示屏从入门到精通:手把手教你用Arduino驱动显示自定义字符