当前位置: 首页 > news >正文

Agent 的工具是如何被大模型使用的

Agent 的工具是如何被大模型使用的

一篇讲清“工具选择 - 工具调用 - 工具结果回传 - 再推理”的实战笔记

一、前提

先记住一个最重要的结论:

Agent 每次发给大模型的,不只是用户问题,还会带上历史消息和工具信息。

也就是说,模型看到的不是“单独一句话”,而是:

  • 当前用户在问什么
  • 前面聊过什么
  • 现在有哪些工具可以用
  • 每个工具怎么调用、参数是什么

所以,工具并不是模型自己“长出来”的能力,而是 Agent 把工具说明和上下文一起喂给模型后,模型再决定要不要用、怎么用。

图 1:Agent 与大模型的基本关系

用户输入

Agent

大模型

历史消息

工具信息

二、先把流程说透

工具使用不是“一步到位”的,它通常是一个循环:

  1. 用户发出任务。
  2. Agent 把历史消息和工具信息一起发给大模型。
  3. 大模型判断要不要调用工具。
  4. 如果要调用,就输出一个工具调用请求。
  5. Agent 执行这个工具。
  6. 工具结果再回传给大模型。
  7. 大模型继续思考,直到给出最终答案。

这个过程看起来像模型在“亲自操作文件”,实际上不是。
真正执行readFilewriteFile的,还是 Agent 侧的程序。

图 2:工具调用的完整闭环

工具大模型Agent用户工具大模型Agent用户提出任务历史消息 + 工具信息 + 当前问题选择工具 / 生成工具调用执行工具返回结果把工具结果继续发回去最终回复

三、工具信息到底长什么样

工具信息可以理解成一份“说明书”。

至少会包含这几类内容:

  • name:工具名
  • description:工具用途
  • parameters:需要哪些参数
  • required:哪些参数必填

例如:

{"name":"readFile","description":"读取指定文件内容","parameters":{"type":"object","properties":{"path":{"type":"string","description":"文件路径"}},"required":["path"]}}

模型看到这份信息后,才知道:

  • 这个工具能干什么。
  • 它需要传什么参数。
  • 什么时候适合调用它。

四、例子一:只有readFile工具

现在有一个场景:

  • Agent 只提供了readFile工具。
  • 用户要求读取a.txt

可能发生什么

如果文件路径没问题,流程就很简单:

  1. 用户说“帮我读a.txt”。
  2. Agent 把这个问题连同工具信息发给大模型。
  3. 大模型发现可以用readFile
  4. 大模型发起工具调用:readFile(path="a.txt")
  5. Agent 执行读取。
  6. Agent 把文件内容回传给大模型。
  7. 大模型组织成自然语言回复给用户。

如果读取报错

比如a.txt不存在、路径写错、权限不足,或者文件编码有问题,就会出现报错。

这时的关键点是:

  • 报错不是模型自己“看见文件系统报错”
  • 而是 Agent 执行工具后,把错误信息回传给模型
  • 模型再根据错误信息决定下一步

这一步很重要,因为它说明了:

大模型不是直接访问磁盘,而是通过 Agent 提供的工具间接访问。

图 3:只提供readFile时的流程

思考: 用 readFile

读取 a.txt

用户: 读取 a.txt

Agent

大模型

readFile 工具

成功?

返回文件内容给 Agent

返回报错信息给 Agent

最终回复或继续追问

五、例子二:同时提供readFilewriteFile

第二个场景更完整一点:

  • Agent 提供了readFilewriteFile
  • 任务是:读取a.txt的内容,然后纯净地写入b.txt

这里的“纯净写入”可以理解为:

  • 不额外加解释
  • 不夹带多余文本
  • 只把a.txt的内容写到b.txt

这个场景里大模型怎么想

大模型看到工具信息后,会做一轮“任务分解”:

  1. 先读a.txt
  2. 拿到内容以后,再写入b.txt

也就是说,模型不是一次性把两个工具同时用完,而是先完成前一步,再决定下一步。

这个流程为什么合理

因为工具调用不是纯文本回答,而是一个带状态的多轮执行过程。

模型需要先知道:

  • 读取结果是什么
  • 内容是否成功拿到
  • 要不要原样写入
  • 有没有格式转换需求

六、标准版流程

可以整理成下面这样:

Agent

大模型

思考: 读文件, 找工具 readFile

调用 readFile 工具读取文件

返回文件内容给 Agent

继续思考: 读取后开读写流程

调用 writeFile 工具把内容写入 b.txt

写入成功

七、为什么模型能“选对工具”

原因不是模型真的认识你的代码仓库,而是工具说明把能力边界讲清楚了。

模型会根据这几个信号判断:

  1. 工具名字像不像我要的能力。
  2. 工具描述是不是符合当前任务。
  3. 参数结构能不能满足当前需求。
  4. 上下文里有没有前置结果需要承接。

比如:

  • readFile很明显适合“读取文件”
  • writeFile很明显适合“写入文件”
  • searchWeb很明显适合“查资料”

所以,工具描述写得越清楚,模型越容易选对。

八、为什么工具调用不是直接回答

模型有两种常见输出方式:

  1. 直接回答用户。
  2. 先发起工具调用,再等工具结果回来后继续回答。

当任务涉及外部世界时,模型通常会优先走第二条路。

例如:

  • 读文件
  • 查数据库
  • 查天气
  • 调用支付接口
  • 发消息

这些都不是纯语言推理能完成的事情,必须靠工具。

九、工具消息和普通消息的区别

普通消息是对话内容,工具消息是执行结果。

可以简单理解为:

  • 用户消息:提出需求
  • 助手消息:决定下一步
  • 工具消息:告诉模型“刚才执行结果是什么”

这样模型就能在“思考 - 执行 - 再思考”之间循环。

十、实战总结

把这件事说透,其实就是一句话:

大模型不会自己操作文件系统,Agent 会把工具信息发给模型,模型决定调用哪个工具,Agent 再负责真正执行。

如果再展开一点,就是:

  • 历史消息让模型知道上下文
  • 工具信息让模型知道可用能力
  • 工具执行结果让模型知道下一步怎么走

这就是 Agent 工具能够被大模型使用的完整逻辑。

http://www.jsqmd.com/news/1070164/

相关文章:

  • 本地部署ChatGLM3、Qwen2、DeepSeek-V3全栈实操:手把手配置CUDA 12.4+Triton+vLLM,3步实现吞吐翻倍、延迟压至87ms
  • Windows系统管理终极指南:Chris Titus Tech WinUtil一键搞定所有烦恼
  • 终极指南:如何在Intel UHD显卡上配置MPV实现4K视频流畅播放
  • 普通软件接入 AI API 的完整方案:功能设计、接口封装、鉴权配置与常见排错
  • 设置目标IP的端口是否开放
  • 遥感水环境智能监测:从数据预处理到AI反演的60个实战案例
  • 联想百应AI主机300 vs ibbot青春版:当26999元的本地工作站遇到1999元的AI手机,谁更懂AI原生时代?
  • 5分钟掌握Chatterbox:开源语音合成的完整实践指南
  • Pose-Search:用人体姿态解锁图像搜索的终极指南
  • PyPDF终极指南:Python中最强大的PDF处理库完全解析
  • 终极指南:四步让旧Mac免费升级最新macOS系统
  • 怀宁设计公司哪家值得选
  • Mac右键菜单功能少?MouseBoost Pro v5.1.0 帮你一键扩展
  • Hermes Agent:会悄悄 “进化” 的 AI 助手,到底藏着什么秘密?
  • 文档格式统一化革命:用markitdown打破信息孤岛的智能方案
  • Windows系统管理神器:Chris Titus Tech WinUtil完全指南
  • 一卡双用:如何用Radeon大显存优势兼顾大模型推理与视觉创作
  • 【图片添加不同水印】批量图片添加不同的水印,将文件名批量作为图片水印添加上去的步骤和方法
  • Boss Show Time:招聘信息时效性终极指南 - 精确掌握每个职位的发布时间
  • 诸城哪家医院能做近视手术
  • 题解:洛谷 AT_abc463_c [ABC463C] Tallest at the Moment
  • TradingAgents-CN:重新定义AI量化交易的多智能体系统架构深度解析
  • AGC/AVC 考核不达标?多合一光伏 “四可” 精准匹配电网要求
  • windows x64位系统函数调用如何传递参数
  • 什么是 Vibe Coding:AI 时代程序员如何从“手写代码”转向“意图驱动开发”
  • 【限时解密】Adobe Firefly 4.2隐藏功能曝光:设计师用它批量生成合规商用素材,平均节省11.7小时/周
  • Python内存管理的终极奥秘:引用计数机制如何实现高效垃圾回收
  • 成都靠谱全屋智能公司大盘点
  • 【求职】找工作如何卡Bug(第四篇):人脉不是你认识谁,而是谁愿意为你背书
  • Windows系统管理革命:从繁琐操作到一键智能的四个效率跃迁