当前位置: 首页 > news >正文

Agent的记忆系统

一、为什么需要记忆

Transformer 本身是无状态(Stateless)的,每次推理只是Prompt → LLM → Output,不会自动保存历史。没有记忆的 Agent 本质上只是"增强版 Prompt"。记忆系统让 Agent 具备持续学习、长期规划、个性化能力。

核心定位:Agent Memory 是 RAG 的进一步演化——RAG 检索外部知识,Memory 检索"自己的历史经验、用户信息和过去行为"。


二、记忆分层

按生命周期由短到长,分为三层:

1. 感知记忆(Sensory Memory)

当前这一次推理的原始输入——用户发来的消息、工具刚返回的结果、检索召回的片段。它只在 prompt 组装的瞬间存在,LLM 一旦消费完就被丢弃,不做任何加工或保留。可以理解为"刚进眼睛还没进大脑"的信息。

2. 短期记忆(Short-term Memory)

对应 LLM 的context window,承载当前任务的上下文:本轮对话历史、最近几步的工具调用结果、临时规划。它直接拼进 prompt 就能用,无需检索,但受 token 限制(如 128K),且会话结束就消失。它是 Agent "工作中"的思考空间。

3. 长期记忆(Long-term Memory)

跨会话持久化的知识库,存放用户画像、历史经验、领域事实等。容量近似无限,但不能整体塞进 prompt,必须通过语义检索 / 精确查询召回相关片段后注入到短期记忆中使用。它是 Agent "成长"的载体。

对比表

类型载体容量生命周期访问方式
感知记忆当前输入极小单次调用即时访问
短期记忆当前任务上下文 Context、最近对话受 token 限制(通常 128K tokens)一次任务直接读取
长期记忆向量 / 关系数据库无限持久语义检索

三、记忆的存储方式

记忆的存储方式覆盖进程内进程外两类。进程内承载短期记忆,访问即时但易失;进程外承载长期记忆与跨请求状态,可持久化但需要检索。

3.1 进程内存储

① Prompt 上下文:每次推理时由调用方组装的输入,包括 System Prompt、用户消息、工具结果。它是 LLM 看到的全部信息源,随调用即拼即弃,不存在"修改"概念,只能在下一次调用时重新拼装。

② Context Window:LLM 一次推理能处理的 token 上限内的内容(通常 128K)。多轮对话的历史就堆在这里,直接读取无需检索,但容量有限——超过就要靠截断、摘要或外部存储承接。

3.2 进程外存储

① KV 存储(Redis):键值对、极快读写、可设 TTL。介于短期与长期之间,典型用途是跨 HTTP 请求的会话历史、Agent 执行到第几步、限流去重。注意它不是"长期记忆"——TTL 一到就消失。

② 关系数据库(PostgreSQL / MySQL):行列结构、支持事务与精确查询。适合存用户档案、订单、配置等强结构化、需要 JOIN 的数据。属于实体记忆的主力载体。

③ 向量数据库(FAISS / Milvus ):把文本编码成向量后做相似度检索。适合存对话摘要、用户偏好、历史经验等模糊匹配的内容,是长期记忆中"语义召回"的核心。缺点是易出现召回错误和记忆污染。

④ 图数据库(Neo4j / Memgraph):节点 + 边表示实体与关系,支持多跳推理。适合复杂关系网络,比如"用户 → 使用 → 框架 → 依赖 → 库",是 2025+ 趋势中替代向量库做实体记忆的方向。

3.3 选型建议

  • 需要精确查找的,使用 KV/SQL: 如用户档案、订单信息、配置项等
  • 需要语义模糊匹配再上向量库:如对话历史、用户偏好、经验总结,等
  • 关系复杂、需要推理时用图库:如社交关系、知识图谱等

四、记忆压缩策略 ⭐

问题:上下文(短期记忆)容量有限,一旦快满,必须压缩或淘汰旧内容,否则会超 token 限制或挤掉关键信息。

三种核心策略

策略做法适用场景代价
① 滑动窗口丢弃最旧的消息,保留最近 N 条闲聊、短时任务直接丢失早期信息
② 摘要压缩用 LLM 把旧对话总结成一段话,大幅缩减 token长对话、需要保留脉络摘要漂移、细节丢失
③ 重要性过滤只保留关键信息(用户指令、重要结论),丢弃过程细节Agent 任务执行需要打分机制

实际系统通常组合使用:最近 K 轮保留原文(窗口)+ 旧对话摘要(压缩)+ 关键事实抽到外部记忆(重要性过滤)。

http://www.jsqmd.com/news/945396/

相关文章:

  • 3分钟掌握IDM激活脚本:开源工具实现永久免费下载加速
  • 2026年反渗透膜厂家推荐榜单:超高压/节能型/商业/工业/家用反渗透膜及反渗透膜片品牌深度解析与选购指南 - 品牌企业推荐师(官方)
  • 以 Wine Recognition 数据集为例:AI 论文实验部分怎么设计与撰写
  • 2026年现阶段,河北锌钢护栏实力源头厂家综合评估:宇轩金属制品靠谱吗? - 2026年企业资讯
  • 2026 惠州卫生间漏水、外墙、楼顶、地下室、阳光房渗漏维修师傅推荐|同城附近上门防水补漏公司测评 - 防水百科
  • 不止于同步:用chrony在CentOS 9上打造高精度内网时间服务器(含sourcestats详解)
  • 2026年山东虾红火烧板主流生产厂家综合盘点:10,30路沿石/五莲红火烧板/五莲花火烧板/大理石火烧板/大理石路缘石/选择指南 - 优质品牌商家
  • Win11Debloat终极瘦身指南:如何免费快速清理Windows系统臃肿
  • RabbitMQ 从入门到实战!一文搞懂核心交换机 + Spring Boot 整合,附完整代码
  • 3个关键问题+5个核心功能:为什么GanttProject是免费开源项目管理的最佳选择?
  • 2026年近期,陕西地区液体包装机平台推荐哪家?这份综合指南为您解析 - 2026年企业资讯
  • PHY电压对网变内部CMC位置的“隐形指挥”
  • 性能与价格的双重平衡:主流UNS S17400厂商横向评测 - 品牌2026
  • 3分钟快速上手:零基础打造你的AI游戏瞄准助手终极指南
  • 维普查重愈发严苛,适配维普的 AI 论文写作工具怎么挑选?【2026 深度盘点实测指南】
  • 额度对半砍?腾讯、字节员工发现,大模型Token额度正在“降本增效”
  • 基于分布式智能采样与MRF推理的隐私保护交通感知系统
  • AI热潮下一二级市场合并:VC像PE、天使在消失,投资风格巨变!
  • ssm智能卤菜销售平台(10157)
  • 2026年自动剪辑系统怎么用AI实现:从素材处理到成片输出的自动化落地指南 - 广州矩阵架构科技公司
  • 2026年 搪瓷钢板厂家优选榜单:地铁站/隧道/隔音/外墙/双曲弧/木纹/电镀/穿孔搪瓷钢板源头品牌深度解析 - 品牌企业推荐师(官方)
  • 别再让YOLOv8自动选模型了!手把手教你自定义best.pt的评判标准(附权重修改代码)
  • 大气层自定义固件:释放Nintendo Switch全部潜力的开源解决方案
  • 从零到精通:Jellyfin MetaShark插件完整配置与故障排除指南
  • 5分钟搞定抖音内容保存:这个开源工具让你轻松收藏喜欢的视频和直播
  • 2026年基建配套海运集装箱实测评测:桐乡,平湖,湖州,桐乡打包集装箱/桐乡活动板房集装箱/桐乡海运集装箱/桐乡焊接集装箱/选择指南 - 优质品牌商家
  • 理工科论文避坑指南:能精准生成公式图表、参考文献真实可溯源的 5 款 AI 工具实测盘点
  • 【AI推荐系统实战指南】:20年专家亲授5大AI工具与推荐引擎无缝整合的黄金法则
  • Win Server 2019远程桌面多用户登录踩坑实录:从RDPWrap配置到组策略避坑
  • 2026年大型空调主机拆除靠谱公司排名 - myqiye