当前位置：首页 > news >正文

面试官皱眉：“你的 Agent 跑了10轮之后还靠谱吗”，我说：“靠谱啊，为啥不靠谱？”，面试官让我回去再想想。。。

news 2026/6/25 13:49:37

一、上下文漂移：Agent 为什么跑着跑着就偏了？

现象：目标悄悄变了

你让 Agent “分析这份销售数据，找出下滑原因”，理想流程是：读数据 → 分析趋势 → 定位原因 → 输出报告。

实际跑起来可能是：读数据 → 发现格式有问题，开始修格式 → 修完格式又发现某个字段缺失，去查文档 → 查文档时被另一段内容吸引，开始做竞品分析 → 跑了10步，原始任务"找出下滑原因"一个字没碰。

这就是上下文漂移：Agent 的执行方向，悄悄偏离了原始目标。

不是模型"变傻了"，是它在每一步都在做"当前上下文下最合理的下一步"，但"最合理"不等于"最符合原始目标"。

根因：从注意力机制理解"为什么偏"

一些录友会说"Agent 跑久了会偏"，但讲不清为什么偏。要真正理解漂移，得回到 Transformer 本身。

Self-Attention 的核心机制：每个 Token 对所有 Token 计算注意力权重，加权求和得到表示。这个机制带来了两个直接后果：

**第一，注意力有"近因效应"。**Self-Attention 的权重不是均匀分配的，模型倾向于给最近的 Token 更高的权重。

原始指令在最前面，中间隔着大量中间结果，到后面几步时，原始指令的注意力权重已经被"稀释"了。Agent 不是"忘了"目标，是目标在它的注意力里占比越来越低。

**第二，中间结果会"抢焦点"。**Agent 每一步的输出都追加到上下文里，这些中间结果本身就是新的刺激信号。

比如修格式时产生的日志、查文档时看到的内容，都会吸引模型的注意力。上下文越长，干扰信号越多，原始目标越容易被淹没。

这和 Transformer 那篇讲的 **“Lost in Middle”**是同一类问题：上下文中间的信息最容易被忽略，而原始指令恰好被推到了"中间"甚至"开头"的位置。

总结一句话：上下文漂移的本质，是原始目标在注意力分配中逐渐失焦。

注意力稀释过程

漂移的三种模式

不是所有漂移都一样，识别模式才能对症下药：

目标漂移：Agent 从任务 A 滑到任务 B。本来在分析销售数据，跑着跑去做竞品分析了。原始目标被新刺激完全替代。

优先级漂移：任务没变，但主次倒置了。本来"找出下滑原因"是主线、"修格式"是支线，结果 Agent 在支线上花了大半步骤，主线反而没推进。

风格漂移：目标和优先级都没偏，但输出风格变了。开头按要求输出结构化 JSON，跑了几步开始写大段自然语言解释。这种漂移最隐蔽，不影响任务完成但影响下游消费。

漂移三种模式

检测信号：怎么知道漂移了？

漂移不是突然发生的，是有信号的。关键是你得监控这几个指标：

当前动作与原始目标的关联度：如果连续两步的输出和原始目标没有直接关系，大概率在漂
步骤重复率：Agent 反复执行同一类操作（比如反复修格式），说明卡在子任务里出不来了
目标完成进度：跑了N步，原始目标的完成度还是0%，明显偏了

工程上可以做一个简单的漂移检测：每执行K步，把当前状态和原始目标丢给模型，让它判断"当前是否还在朝目标前进"。成本不高，但能有效抓住漂移。

解法分层：从简到难，每个都有代价

第一层：任务分解 + 子目标检查点

把复杂任务拆成有序子任务，每个子任务有明确的完成标准。Agent 完成一个子任务后，先检查"原始目标推进了吗"，再决定下一步。

这是最简单也最有效的方式，适用于大部分场景。代价是：需要提前设计任务分解策略，对简单任务来说增加了不必要的开销。

第二层：上下文压缩

当上下文过长时，对历史步骤做摘要压缩，只保留关键信息。核心思路是控制上下文中"干扰信号"的量，让原始目标始终保持足够的注意力占比。

代价是：压缩可能丢失细节，某些场景下摘要信息不够精确。

第三层：定期 Re-Planning

每隔N步，暂停执行，让 Agent 重新审视原始目标和当前进度，重新规划后续步骤。相当于一个"航向校正"机制。

代价是：每次 Re-Planning 都是一次额外的 LLM 调用，增加了延迟和成本。但对长任务来说，这个代价远低于跑偏后全部重来的成本。

漂移解法分层

二、工具调用幻觉：Agent 为什么调了不该调的工具？

现象：不是不会调，是调错了

你给 Agent 配了3个工具：search_database、search_web、send_email。

理想情况：用户问"上个月销售额多少"，Agent 调用search_database，拿到数据，回复用户。

实际可能发生的事：

Agent 调了一个search_api——你的工具列表里根本没有这个
Agent 调了search_database，但参数传了date: "明天"——接口要求YYYY-MM-DD格式
用户只是闲聊"今天天气不错"，Agent 硬是调了search_web去搜天气——根本不需要调工具

这就是工具调用幻觉：Agent 在工具调用上产生了"虚构"行为。

根因：从概率生成理解"为什么幻觉"

理解工具调用幻觉，要搞清楚一个关键事实：模型选工具，不是在查表，是在猜。

大模型的每一步输出都是概率采样。工具调用也一样——模型不是从工具列表里"查找"最匹配的工具，而是根据上下文预测"下一个最可能出现的工具名"。

这意味着：

如果工具描述模糊，多个工具看起来"都可能对"，模型就靠概率选，选错就是幻觉
如果参数类型没约束，模型按"感觉"填值，填出来的格式和类型可能完全不对
如果模型被训练得"太积极"（过度倾向于使用工具），它会在不需要工具的时候也硬调一个

总结一句话：工具调用幻觉的本质，是概率生成遇到了结构性约束不足。

幻觉的三种类型

不同类型的幻觉，根因不同，解法也不同：

Type 1：调用不存在的工具

Agent 生成了一个工具列表里没有的工具名。比如你只有search_database和search_web，它调了search_api。

根因：工具描述和任务描述之间存在"语义缝隙"，模型根据任务"编"了一个看起来合理的工具名。你的工具叫search_database，但任务描述里提到"搜索数据"，模型可能觉得search_api更匹配。

Type 2：参数类型或格式错误

工具调对了，但参数传错了。比如接口要求limit: integer，模型传了limit: "十个"；要求date: "YYYY-MM-DD"，模型传了date: "上周五"。

根因：参数的类型约束和格式约束没有在工具描述中明确声明，模型按自然语言习惯生成参数值，而不是按接口要求。

Type 3：无意义的工具调用

本来不需要调工具，Agent 硬调了一个。用户问"你好"，Agent 调search_web搜"问候语"。

根因：模型有"工具使用倾向"——训练数据中，使用工具的对话往往得到更高的奖励信号，导致模型过度倾向于调用工具，哪怕当前不需要。

幻觉三种类型×对应解法

解法：每种幻觉对应不同策略

对抗 Type 1（调错工具）：工具描述结构化

核心思路：让模型对工具的"边界"有清晰认知。

工具描述不要只写"搜索数据库"，要写清楚"搜索数据库，仅支持SQL查询，不支持API调用"
每个工具加 Few-shot 示例，展示什么场景该调这个工具、什么场景不该调
调用前校验：模型输出的工具名必须在注册列表中，否则拒绝执行

对抗 Type 2（参数错误）：参数 Schema 约束

核心思路：用结构化约束替代自然语言"希望"。

工具的每个参数都要有 JSON Schema 定义：类型、枚举值、格式、是否必填
利用模型的结构化输出能力（response_format或tool_choice），让模型按 Schema 生成参数
调用前对参数做类型检查和格式验证，不通过则重试

对抗 Type 3（无意义调用）：调用必要性判断

核心思路：给模型一个"不调工具"的选项。

在工具列表中显式加入"无工具需要调用"的选项，让模型知道不调工具也是合法选择
调用前加一层判断：当前用户意图是否真的需要工具？如果只是闲聊、确认、总结，直接回复
设置调用频率阈值：同一轮对话中，如果工具调用次数超过N次，触发人工确认

通用防线：调用全流程校验

不管哪种幻觉，都可以用一套"三段式"防线兜底：

调用前：校验工具名是否在注册列表中，参数是否符合 Schema，是否满足调用必要性

调用中：设置超时和异常捕获，工具执行失败不要直接暴露给模型原始错误（容易触发下一轮幻觉），而是转化为结构化的错误信息

调用后：校验返回结果是否符合预期格式，异常结果触发重试（最多2-3次），超过重试次数则降级处理

这套防线不解决根因，但能有效拦截大部分幻觉的后果。根因靠工具描述和参数约束解决，兜底靠全流程校验保障。

调用全流程校验

三、面试怎么答

面试官问 Agent 可靠性问题，不要只说"会用 XX 框架"，要展示从根因到解法的系统性思维。

参考回答思路：

"Agent 的核心可靠性问题，我认为最关键的是上下文漂移和工具调用幻觉。

上下文漂移的根因在注意力机制——上下文越长，原始目标在注意力分配中占比越低，Agent 被’近因效应’带偏。我的解法是分层处理：短任务用任务分解加检查点，长任务加定期 Re-Planning 做航向校正，超长任务用上下文压缩控制信息量。

工具调用幻觉的根因在概率生成——模型不是查表选工具，是预测下一个最可能的工具名，约束不足就会猜错。我的解法是按幻觉类型对症下药：调错工具靠描述结构化，参数错误靠 Schema 约束，无意义调用靠必要性判断。再叠加调用前中后的三段式校验做兜底。

这两个问题的共同点是：都是概率生成模型的固有特性，不是 bug，需要在工程层面做约束和兜底。"

这个回答从模型机制讲到工程方案，再给出取舍判断，比只背解法清单高一档。

面试官问 Agent 可靠性，不是要你证明"我的 Agent 不出错"，是要你证明你知道它会出什么错、为什么出错、出了错怎么兜住。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～