当前位置：首页 > news >正文

Agent 的工具是如何被大模型使用的

news 2026/6/24 2:53:32

Agent 的工具是如何被大模型使用的

一篇讲清“工具选择 - 工具调用 - 工具结果回传 - 再推理”的实战笔记

一、前提

先记住一个最重要的结论：

Agent 每次发给大模型的，不只是用户问题，还会带上历史消息和工具信息。

也就是说，模型看到的不是“单独一句话”，而是：

当前用户在问什么
前面聊过什么
现在有哪些工具可以用
每个工具怎么调用、参数是什么

所以，工具并不是模型自己“长出来”的能力，而是 Agent 把工具说明和上下文一起喂给模型后，模型再决定要不要用、怎么用。

图 1：Agent 与大模型的基本关系

二、先把流程说透

工具使用不是“一步到位”的，它通常是一个循环：

用户发出任务。
Agent 把历史消息和工具信息一起发给大模型。
大模型判断要不要调用工具。
如果要调用，就输出一个工具调用请求。
Agent 执行这个工具。
工具结果再回传给大模型。
大模型继续思考，直到给出最终答案。

这个过程看起来像模型在“亲自操作文件”，实际上不是。
真正执行readFile、writeFile的，还是 Agent 侧的程序。

图 2：工具调用的完整闭环

三、工具信息到底长什么样

工具信息可以理解成一份“说明书”。

至少会包含这几类内容：

name：工具名
description：工具用途
parameters：需要哪些参数
required：哪些参数必填

例如：

{"name":"readFile","description":"读取指定文件内容","parameters":{"type":"object","properties":{"path":{"type":"string","description":"文件路径"}},"required":["path"]}}

模型看到这份信息后，才知道：

这个工具能干什么。
它需要传什么参数。
什么时候适合调用它。

四、例子一：只有`readFile`工具

现在有一个场景：

Agent 只提供了readFile工具。
用户要求读取a.txt。

可能发生什么

如果文件路径没问题，流程就很简单：

用户说“帮我读a.txt”。
Agent 把这个问题连同工具信息发给大模型。
大模型发现可以用readFile。
大模型发起工具调用：readFile(path="a.txt")。
Agent 执行读取。
Agent 把文件内容回传给大模型。
大模型组织成自然语言回复给用户。

如果读取报错

比如a.txt不存在、路径写错、权限不足，或者文件编码有问题，就会出现报错。

这时的关键点是：

报错不是模型自己“看见文件系统报错”
而是 Agent 执行工具后，把错误信息回传给模型
模型再根据错误信息决定下一步

这一步很重要，因为它说明了：

大模型不是直接访问磁盘，而是通过 Agent 提供的工具间接访问。

图 3：只提供`readFile`时的流程

五、例子二：同时提供`readFile`和`writeFile`

第二个场景更完整一点：

Agent 提供了readFile和writeFile。
任务是：读取a.txt的内容，然后纯净地写入b.txt。

这里的“纯净写入”可以理解为：

不额外加解释
不夹带多余文本
只把a.txt的内容写到b.txt

这个场景里大模型怎么想

大模型看到工具信息后，会做一轮“任务分解”：

先读a.txt。
拿到内容以后，再写入b.txt。

也就是说，模型不是一次性把两个工具同时用完，而是先完成前一步，再决定下一步。

这个流程为什么合理

因为工具调用不是纯文本回答，而是一个带状态的多轮执行过程。

模型需要先知道：

读取结果是什么
内容是否成功拿到
要不要原样写入
有没有格式转换需求

六、标准版流程

可以整理成下面这样：

七、为什么模型能“选对工具”

原因不是模型真的认识你的代码仓库，而是工具说明把能力边界讲清楚了。

模型会根据这几个信号判断：

工具名字像不像我要的能力。
工具描述是不是符合当前任务。
参数结构能不能满足当前需求。
上下文里有没有前置结果需要承接。

比如：

readFile很明显适合“读取文件”
writeFile很明显适合“写入文件”
searchWeb很明显适合“查资料”

所以，工具描述写得越清楚，模型越容易选对。

八、为什么工具调用不是直接回答

模型有两种常见输出方式：

直接回答用户。
先发起工具调用，再等工具结果回来后继续回答。

当任务涉及外部世界时，模型通常会优先走第二条路。

例如：

读文件
查数据库
查天气
调用支付接口
发消息

这些都不是纯语言推理能完成的事情，必须靠工具。

九、工具消息和普通消息的区别

普通消息是对话内容，工具消息是执行结果。

可以简单理解为：

用户消息：提出需求
助手消息：决定下一步
工具消息：告诉模型“刚才执行结果是什么”

这样模型就能在“思考 - 执行 - 再思考”之间循环。

十、实战总结

把这件事说透，其实就是一句话：

大模型不会自己操作文件系统，Agent 会把工具信息发给模型，模型决定调用哪个工具，Agent 再负责真正执行。

如果再展开一点，就是：

历史消息让模型知道上下文
工具信息让模型知道可用能力
工具执行结果让模型知道下一步怎么走

这就是 Agent 工具能够被大模型使用的完整逻辑。

查看全文

http://www.jsqmd.com/news/1070164/

本地部署ChatGLM3、Qwen2、DeepSeek-V3全栈实操：手把手配置CUDA 12.4+Triton+vLLM，3步实现吞吐翻倍、延迟压至87ms

Windows系统管理终极指南：Chris Titus Tech WinUtil一键搞定所有烦恼

终极指南：如何在Intel UHD显卡上配置MPV实现4K视频流畅播放

普通软件接入 AI API 的完整方案：功能设计、接口封装、鉴权配置与常见排错

设置目标IP的端口是否开放

遥感水环境智能监测：从数据预处理到AI反演的60个实战案例

联想百应AI主机300 vs ibbot青春版：当26999元的本地工作站遇到1999元的AI手机，谁更懂AI原生时代？

5分钟掌握Chatterbox：开源语音合成的完整实践指南

Pose-Search：用人体姿态解锁图像搜索的终极指南

PyPDF终极指南：Python中最强大的PDF处理库完全解析

终极指南：四步让旧Mac免费升级最新macOS系统

怀宁设计公司哪家值得选

Mac右键菜单功能少？MouseBoost Pro v5.1.0 帮你一键扩展

Hermes Agent：会悄悄 “进化” 的 AI 助手，到底藏着什么秘密？

文档格式统一化革命：用markitdown打破信息孤岛的智能方案

Windows系统管理神器：Chris Titus Tech WinUtil完全指南

一卡双用：如何用Radeon大显存优势兼顾大模型推理与视觉创作

【图片添加不同水印】批量图片添加不同的水印，将文件名批量作为图片水印添加上去的步骤和方法

Boss Show Time：招聘信息时效性终极指南 - 精确掌握每个职位的发布时间

诸城哪家医院能做近视手术

题解：洛谷 AT_abc463_c [ABC463C] Tallest at the Moment

TradingAgents-CN：重新定义AI量化交易的多智能体系统架构深度解析

AGC/AVC 考核不达标？多合一光伏 “四可” 精准匹配电网要求

windows x64位系统函数调用如何传递参数

什么是 Vibe Coding：AI 时代程序员如何从“手写代码”转向“意图驱动开发”

【限时解密】Adobe Firefly 4.2隐藏功能曝光：设计师用它批量生成合规商用素材，平均节省11.7小时/周

Python内存管理的终极奥秘：引用计数机制如何实现高效垃圾回收

成都靠谱全屋智能公司大盘点

【求职】找工作如何卡Bug（第四篇）：人脉不是你认识谁，而是谁愿意为你背书

Windows系统管理革命：从繁琐操作到一键智能的四个效率跃迁