[智能体-450]:单 Agent(自主规划模式),如何大模型更精确的决策,调用外部插件和内部记忆单元?
单 Agent(自主规划模式)精准决策调用插件 / 记忆单元完整方案
自主规划模式核心痛点:大模型自由决策容易漏调用知识库、数据表、长期记忆、自定义插件,通过工具约束、Prompt 工程、参数管控、资源分级、校验兜底五层手段,强制模型精准判断何时调用对应资源。
一、第一层:标准化工具注册与清晰工具元信息(底层基础)
自主规划模式所有资源(知识库、数据库、长期记忆、自定义插件)都会注册为 Function Calling 工具,工具描述决定模型判断精度。
1. 每个工具必须写完整、区分度极强的描述
禁止模糊描述,必须写明适用场景、输入参数、返回内容、不调用的后果。
示例规范模板:
1)文本知识库工具描述
工具名称:query_public_product_doc 功能:查询全平台通用产品手册、售后政策、规格说明等公共文档;当用户询问产品使用、保修、功能介绍时必须调用;仅存储公共资料,无法查询用户个人订单、手机号。 入参:user_query:用户原始提问文本
2)用户数据库工具描述 工具名称:query_user_order_db 功能:查询当前登录用户的私有订单、工单、历史填报记录;仅能读取当前用户个人数据;用户询问我的订单、我的报修记录、历史提交表单时必须调用;无法查询公共产品政策。
3)长期记忆工具描述 工具名称:search_user_long_memory 功能:检索该用户历史对话留存的个人偏好、需求习惯;当用户提问带有 “之前我说过、我习惯、我想要 XX 风格” 等个人偏好类问题时调用。
4)自定义业务插件(如飞书推送 / 联网搜索) 工具名称:search_internet 功能:实时联网查询 2026 最新资讯、外部实时数据;知识库无实时信息时调用。
2. 工具参数强约束
所有工具入参设置必填字段、参数描述,减少模型传参错误;关闭自由参数生成,强制按定义入参调用。
3. 开启「自动调用」统一管控
页面右上角开启知识库「自动调用」开关,平台会把知识库检索函数强制注入工具列表,模型默认感知该工具存在,不会遗忘。
二、第二层:系统提示词(System Prompt)强制决策规则(核心手段)
在 Agent 人设提示词最顶部写入刚性决策逻辑,分场景明确 “什么情况必须调用、什么情况禁止调用、调用顺序”,直接约束模型思考逻辑。
标准化 Prompt 规则模板(可直接复制使用)
plaintext
# 刚性执行规则,必须严格遵守,违反会导致回答错误 ## 一、工具调用判定规则 1. 公共知识类提问(产品介绍、保修政策、操作教程、行业规范)→ 必须调用【扣子文本知识库】,禁止直接凭空回答; 2. 用户个人数据提问(我的订单、我的工单、我之前提交的表单、我的手机号)→ 必须调用【用户数据库】,禁止查询公共知识库; 3. 用户提及历史偏好、过往对话需求、个人习惯 → 必须先调用【长期记忆】,结合记忆再回答; 4. 需要实时新闻、实时价格、外部网络信息 → 调用【联网搜索插件】; 5. 仅闲聊、通用常识类问题,不涉及以上四类,无需调用任何工具。 ## 二、调用流程约束 1. 优先判断是否需要读取用户私有记忆/数据库;再判断是否需要公共知识库;最后判断是否需要外部插件; 2. 一次思考可以同时调用多个工具,允许并行查询知识库+数据库; 3. 禁止跳过工具直接回答;若工具返回无匹配内容,再如实告知用户,不得编造信息; 4. 禁止混淆工具边界:不能用公共知识库查询用户私人订单,不能用数据库查询产品政策。 ## 三、输出约束 每次回答前,先输出你的思考过程:你判断用户问题需要调用哪些工具、判断依据;再执行工具调用,最后整合所有工具返回内容生成答案。关键设计逻辑
- 明确工具边界,把 “什么场景对应什么工具” 写死,消除模型模糊判断;
- 规定调用优先级,避免模型只调用单一资源遗漏其他;
- 强制输出思考链路,让模型显式推理,降低随机决策偏差。
三、第三层:大模型参数调优,降低随机自由发挥
调整模型推理参数,压缩模型自主发挥空间,提升决策稳定性:
- temperature温度调低至 0.0~0.2 温度越高模型创造力、随机性越强,容易擅自跳过工具;低温度下模型严格遵循 Prompt 规则,决策一致性大幅提升;
- top_p 设置为 0.1~0.3限制模型采样范围,减少偏离指令的自由推理;
- 开启强制工具返回模式Coze 自主规划模式内置参数:
force_tool_choice="auto",搭配提示词强制要求 “有匹配场景必须选对应工具”,模型无法直接返回文本跳过工具调用。
四、第四层:资源分层隔离 + 工具分类分组,减少混淆
1. 公私资源彻底拆分
- 公共资源(文本 / 表格 / 照片知识库)统一归为「公共知识工具组」;
- 用户私有资源(数据库、长期记忆)归为「用户私有记忆工具组」;
- 外部第三方(联网、绘图、飞书等插件)归为「外部插件工具组」; 在 System Prompt 中明确三组工具的适用边界,模型不会混淆公私数据。
2. 冗余资源精简,减少模型选择困难
不要一次性挂载数十个无关插件,只挂载当前业务必须的工具;工具数量过多会导致模型决策混乱、漏调用。 例:售后 Agent 仅挂载:产品知识库、用户工单数据库、长期记忆,移除绘图、游戏等无关插件。
五、第五层:后置校验兜底机制,修正模型决策失误
方案 1:多轮自检强制重调用
在 Prompt 中增加自检规则:
工具调用完成后,自检:用户提问是否涉及私人订单?是否调取数据库?是否涉及产品政策?是否调取知识库?如果漏调用对应工具,立刻重新发起工具调用,不得直接输出回答。
方案 2:失败重试策略
Coze 底层支持工具调用重试配置:
- 模型判断需要工具但未调用:自动触发二次推理,强制重新选择工具;
- 工具入参错误、无返回结果:自动重试 1 次检索,避免单次检索遗漏数据。
方案 3:结果校验节点(高阶复合方案)
若业务精度要求极高,可以把校验逻辑封装为子工作流,作为工具挂载给 Agent:
- Agent 完成一轮回答后,自动调用【校验工作流】;
- 工作流节点校验:回答是否包含用户私有数据、是否引用知识库原文;
- 校验不通过则返回 Agent 重新检索对应记忆 / 知识库,形成闭环兜底。
六、实操完整落地案例(售后智能体)
1. 挂载工具列表
1)文本知识库:耳机产品售后手册 2)数据库:用户工单订单表 3)长期记忆:用户历史对话偏好 4)外部插件:联网搜索实时活动政策
2. Prompt 核心规则
用户问耳机保修、故障维修 → 调用文本知识库; 用户问我的报修记录、我的订单 → 调用数据库; 用户说我之前提过需求、我不喜欢 XX 方案 → 先调取长期记忆; 用户问当前最新优惠活动 → 调用联网插件; 必须先推理判断工具,禁止直接回答。
3. 模型参数
temperature=0.1,top_p=0.2,精简无关插件
4. 效果提升
模型 95% 以上场景可精准区分资源,不会出现 “查订单却调用产品知识库”“漏查用户历史偏好” 等决策错误。
七、常见避坑要点
- ❌ 工具描述写得过于简短笼统,模型分不清工具用途; ✅ 每条工具写明适用场景、禁止场景、调用后果;
- ❌ 温度设置 0.7 以上,模型随机性过高,频繁跳过工具; ✅ 业务决策类 Agent 温度统一 0~0.2;
- ❌ 同时挂载大量无关插件,工具过多造成模型选择混乱; ✅ 按需挂载,移除闲置工具;
- ❌ Prompt 只写人设,不写刚性工具调用规则; ✅ 提示词最顶部放置强制决策逻辑,优先级高于人设;
- ❌ 公私资源混用,不区分知识库和用户数据库; ✅ 在 Prompt 中严格划分公共知识、用户私有记忆的调用边界。
八、核心逻辑总结
自主规划模式想要精准调用插件 / 记忆单元,依靠五层约束层层收紧模型决策:
- 清晰工具定义,让模型看懂每个资源的用途;
- Prompt 写入刚性调用规则,规定场景与工具一一对应;
- 调低模型随机参数,稳定推理逻辑;
- 精简、分组工具,降低选择难度;
- 自检 / 子工作流兜底,弥补模型偶发决策失误。
