当前位置: 首页 > news >正文

【AI】如何设计Agent的记忆系统?

记忆模块是Agent打破LLM上下文窗口限制、实现持续学习和个性化的关键。
设计Agent的记忆系统可以仿照人类的记忆机制。
分为短期记忆和长期记忆。

1、短期记忆(Short-Term Memory):

  • 作用:存储当前任务的上下文信息,包括即时对话历史、中间的思考步骤、工具的调用结果等。
    它是Agent进行连贯思考和行动的基础。
  • 实现方式
    • LLM的上下文窗口(Context Window):这是最直接的短期记忆载体。所有最近的交互都会被放入Prompt中。
    • 缓冲区(Buffers):在Agent框架中(如LangChain)中,通常会使用不同类型的缓冲区来管理对话历史。例如:
      • ConversationBufferMemory:存储完整的对话历史。
      • ConversationBufferWindowMemory:只保留最近的K轮对话。
      • ConversationSummaryBufferWindowMemory:在历史对话过长时,动态地用LLM进行总结,节省Token。
    • 暂存器(Scratchpad):用于记录ReAct框架中"Thought-Action-Observation"轨迹,是Agent进行逐步推理的关键。

2、长期记忆(Long-Term Memory):

  • 作用:存储跨越任务和时间维度的信息。如用户的个人偏好、过去的成功/失败经验、领域知识等,
    它使得Agent能够 学习和成长。
  • 实现方式与外部工具:长期记忆的核心是"存储"和"检索",通常需要借助外部技术。主流的是RAG。
  • 核心技术向量数据库(Vector Database)
  • 工作流程

a.存储(Storing/Writing):当Agent获得一个有价值的信息(如用户明确给出的偏好、一个成功决解问题的完整流程)时
它会使用一个嵌入模型(Embedding Model)将这段文本信息转换成一个高维向量。
然后将这个向量及其原始文本存入向量数据库中。

b.检索(Retrieving/Reading):Agent进行规划或决策时,它会把当前任务或问题也转换成一个查询向量。
然后用这个查询向量去向量数据库中进行相似度检索,找出与当前情况最相关的历史记忆。

c.使用(Using):检索到的记忆(原始文本)会被插入到LLM的Prompt中,作为额外的上下文,来指导LLM做出更明智的决策。

  • 其他技术
    传统数据库/知识图谱:对结构化或关系型数据,使用SQL数据库或图数据库进行存储和精确查询也是一种有效的长期记忆形式。
http://www.jsqmd.com/news/497924/

相关文章:

  • 探索同城招聘系统源码:企业端+求职者端功能开发全流程详解
  • 阿里发布全球首个企业级Agent平台“悟空”,要把“龙虾”装进2000万企业组织里
  • python+Ai技术的学生课外活动管理系统的数据可视化大屏分析系统 _
  • Mixture of Experts(MoE)
  • 808nm在生物医疗科研中的使用方法
  • 英伟达发布Groq 3 LPX推理加速器,瞄准AI基础设施下一战场
  • 【架构】-----Service 层代码太长太乱?试试这套 “见名知意” 的命名规范!
  • 中小企业为什么要重视业财一体化
  • 国内炒黄金的人多不多?炒现货黄金有什么门槛?
  • HBase在大数据领域海量数据存储的解决方案
  • 收藏 | 从零开始学LangGraph,构建能思考的Agentic RAG系统,小白也能轻松上手!
  • 2026高纯度Omega3鱼油推荐榜:高纯度深海鱼油、高纯度鱼油、深海鱼油软胶囊、降血脂鱼油、高纯度omega3选择指南 - 优质品牌商家
  • 2026年了,居然还有免费的BIM软件!
  • Nginx解决前端跨域问题
  • 【JUC并发 | 第八篇】AQS的底层原理
  • 金仓数据库在MySQL迁移中的实践复盘:某汽车集团近百套系统两周平滑替换路径
  • mysql数据库常规操作2
  • 北航软件工程[I.2] 个人作业:软件案例分析
  • 共享内存与进程间通信(IPC):提升TDengine时序数据库内部数据流转效率
  • TCP vs UDP 怎么选(偏实战:别背概念,用场景做决策)
  • 3月面了十几家前端岗后,我才知道大佬这份飞书题库的含金量
  • 求你了,别用 YYYY-MM-dd!
  • comsol 锂枝晶模型 此模型为多枝晶定向形核,可以直接拿来用,不用自己建模,三种物理场:相...
  • 26年春季学期学习记录第8天
  • MySQL索引入门:B+树原理+创建优化,新手也能看懂慢查询优化
  • 汽车电子构架演进(二)AUTOSAR的组成和演进
  • python+Ai技术框架的计算思维与人工智能学习网站设计与实现django flask
  • 【后端新手谈 03】告别满屏 try-catch!全局异常处理器的实用价值
  • 大模型落地实战:深度解析 Transformers、vLLM、Ollama 等 6 大主流部署框架
  • 违章真的会让车险涨价吗?很多车主都搞错了,看完少花几千块!(违章真的会影响车险保费吗?一文讲清楚交强险和商业险的浮动规则)