当前位置: 首页 > news >正文

Agent 记忆系统架构设计:从双层存储到智能整合的工程实践

问题背景

长期运行的 AI Agent 面临一个工程问题:如何管理持续增长的对话历史?

简单方案是把所有对话塞进 context window,但这带来三个问题:token 消耗线性增长、信息冲突无法自动解决、冗余数据拉低检索精度。另一个极端是只保留最近 N 轮,代价是丢失用户偏好和历史经验。

本文分析 Amazon Bedrock AgentCore Memory 的架构设计,讨论其双层存储模型和四种记忆策略的工程实现思路。

架构:双层存储模型

AgentCore Memory 的核心设计是把原始交互提炼知识分离存储。

短期记忆层(Event Store)

不可变的 append-only 存储。每个 Event 包含:

  • actorId:用户标识
  • sessionId:会话标识
  • timestamp:事件时间戳
  • content:原始对话内容

数据模型类似事件溯源(Event Sourcing),只追加不修改。这一层解决的是会话内指代消解——"那个"、"它"、"明天"这些需要上下文才能理解的指代。

长期记忆层(Knowledge Store)

从 Event Store 异步生成的结构化知识。生成过程是一个三阶段管线:

Events → Extraction(提取) → Consolidation(整合去重) → Knowledge↓Reflection(跨场景反思,仅 Episodic)

关键设计决策:

  1. 异步处理:不阻塞对话流程,20-40 秒后台完成
  2. 语义去重:基于向量相似度判断是否为同一事实的不同表述
  3. 冲突解决:时间戳较新的信息自动覆盖旧信息
  4. 检索机制:语义搜索,约 200ms 延迟

四种内置策略的实现分析

1. Semantic Memory

目标:提取离散的事实性信息

处理流程:Extraction + Consolidation

  • Extraction 阶段从对话中识别实体和关系(NER + RE 的 LLM 实现)
  • Consolidation 阶段将新事实与已有知识比对,语义重复则合并,冲突则以新替旧

数据结构:每条记忆是一个独立的 fact triple(主体-属性-值)

2. User Preference Memory

目标:追踪用户偏好的演化

处理流程:Extraction + Consolidation

  • 输出结构化字段:context(场景)、preference(偏好内容)、categories(分类标签)
  • 与 Semantic Memory 的区别:偏好不是简单覆盖,而是按 context 维度独立存储

工程意义:支持"技术文档要详细,日常对话要简洁"这种场景化偏好

3. Summary Memory

目标:长对话的增量压缩

处理流程:仅 Consolidation

  • 不做 Extraction,直接对整个对话做增量摘要
  • 类似 MapReduce 的 reduce 阶段——新对话内容与已有摘要合并

适用场景:对话轮次多但不需要精细事实提取的场景

4. Episodic Memory

目标:从完整交互经验中学习

处理流程:Extraction + Consolidation + Reflection

  • Extraction:自动识别 episode 边界(一个有意义的交互片段,比如"遇到错误→尝试修复→成功")
  • Consolidation:将 episode 压缩为结构化记录
  • Reflection:跨多个 episode 分析规律,生成 meta-knowledge

Namespace 设计

episode:    /strategy/{id}/actor/{actorId}/session/{sessionId}/
reflection: /strategy/{id}/actor/{actorId}/

episode 按会话粒度,reflection 按用户粒度。这意味着一个用户跨多个会话的经验可以被统一反思。

扩展机制

三个层次的扩展能力:

层次 说明 适用场景
Built-in 全自动,零代码 大多数场景
Built-in with Overrides 追加 prompt、换模型 需要领域定制
Self-managed 完全自主管线 需要集成外部系统

Overrides 示例——追加领域指令:

{"strategy_type": "SEMANTIC","overrides": {"append_to_prompt": "重点提取电商订单相关事实:SKU、数量、价格","model_id": "anthropic.claude-3-haiku-20240307-v1:0"}
}

工程 Trade-off

  1. 延迟:长期记忆写入 20-40s,读取 200ms。适合非实时场景
  2. 策略选择:Semantic 适合结构化事实,Episodic 适合经验学习,两者互补
  3. 成本:每次 Extraction/Consolidation 都需要 LLM 调用,strategy 越多成本越高
  4. 一致性:短期记忆强一致,长期记忆最终一致(异步处理窗口内可能读到旧数据)

总结

AgentCore Memory 的架构设计回答了一个核心问题:怎么让 Agent 的记忆像人一样——记住重要的、更新变化的、忘掉冗余的、从经验中学习

双层存储实现了原始数据和知识的分离,四种策略覆盖了事实、偏好、摘要和经验四个维度,三层扩展机制兼顾了开箱即用和深度定制。

对于构建需要持续交互的 Agent 系统,这是目前比较完整的记忆管理参考架构。


Amazon Bedrock:https://aws.amazon.com/cn/bedrock/
Amazon Bedrock AgentCore:https://aws.amazon.com/cn/bedrock/agentcore/
AgentCore Memory 文档:https://docs.aws.amazon.com/bedrock/latest/userguide/agentcore-memory.html

http://www.jsqmd.com/news/485789/

相关文章:

  • Matlab Simulink下的LLC并网与离网逆变器功能介绍:电流闭环控制并网,电压电流双...
  • 2026深度剖析迈从怎么样:多重核心优势加持,彰显强劲市场竞争力 - 速递信息
  • stack的实现,queue的实现,deque的介绍和priority_queue的实现以及仿函数的介绍与运用
  • 从 “Top-K 问题” 入门二叉堆:C 语言从零实现与经典应用
  • SiameseUIE在政务文本分析中的应用:政策文件关键要素抽取实战
  • Proteus仿真下基于多种单片机的波形发生器程序设计:LCD显示、DAC输出与按键调节功能
  • 基于MATLAB的期货预测模型:PSO优化SVM与未优化的SVM对比分析报告
  • RMBG-2.0与Adobe Firefly对比:开源vs闭源,功能覆盖度与可控性深度分析
  • 路面估计模型架构示意图](https://example.com/simulink_architecture_demo.png
  • 2026全新 二手果汁 乳品饮料生产线设备优质厂家推荐指南 - 资讯焦点
  • PWM/pwm整流器电压电流全阶线性自抗扰控制(LADRC)和双闭环控制(双PI)对比,负载为...
  • 感应电机与异步电机的无传感器矢量控制:基于MRAS方法的精确速度估计技术
  • 工业路由器的使用功能与特点有哪些
  • 昆仑通泰锅炉燃烧控制程序案例:触摸屏程序升级至Pro版本
  • DartFish Connect 4.5.2 运动分析软件(中英文双语版)|专业级竞技数据解析工具
  • 西门子HMI监控PLC:梯形图与诊断故障的精简解决方案,偶发性故障可追溯
  • 边坡在降雨作用下的变形与应力分布研究——基于COMSOL的分析
  • 2026格行代理官方招募|邀请码888886,轻资产创业四重收益全解析 - 资讯焦点
  • COMSOL 6.1 激光超声仿真:揭开 Lamb 波数值模拟的神秘面纱
  • JVM面试知识点总结
  • Buck电路Simulink仿真:从开环到闭环控制的探索
  • 2026年白蚁灭治服务应用白皮书 水库堤坝防治深度剖析 - 优质品牌商家
  • 永磁同步电机ADRC自抗扰控制与SVPWM在Matlab Simulink中的仿真之旅
  • LabVIEW框架下的产线MES系统探秘
  • 格行随身WiFi代理邀请码:官方唯一正规渠道 888886 - 资讯焦点
  • vtk-docs-l10n
  • CLIP ViT-H-14镜像免配置:预置中文OCR+CLIP联合分析工作流示例
  • 计算机毕业设计springboot医院挂号与问答系统设计 基于Spring Boot的在线医疗预约与智能问诊平台开发 Spring Boot框架下的医院门诊预约及医患交互系统实现
  • 2026产品视频制作公司哪家好?五大宣传片制作与二维三维动画制作服务商推荐 - 深度智识库
  • 基于Matlab GUI的手势识别之旅