当前位置：首页 > news >正文

Agent 记忆系统架构设计：从双层存储到智能整合的工程实践

news 2026/7/3 11:43:54

问题背景

长期运行的 AI Agent 面临一个工程问题：如何管理持续增长的对话历史？

简单方案是把所有对话塞进 context window，但这带来三个问题：token 消耗线性增长、信息冲突无法自动解决、冗余数据拉低检索精度。另一个极端是只保留最近 N 轮，代价是丢失用户偏好和历史经验。

本文分析 Amazon Bedrock AgentCore Memory 的架构设计，讨论其双层存储模型和四种记忆策略的工程实现思路。

架构：双层存储模型

AgentCore Memory 的核心设计是把原始交互和提炼知识分离存储。

短期记忆层（Event Store）

不可变的 append-only 存储。每个 Event 包含：

actorId：用户标识
sessionId：会话标识
timestamp：事件时间戳
content：原始对话内容

数据模型类似事件溯源（Event Sourcing），只追加不修改。这一层解决的是会话内指代消解——"那个"、"它"、"明天"这些需要上下文才能理解的指代。

长期记忆层（Knowledge Store）

从 Event Store 异步生成的结构化知识。生成过程是一个三阶段管线：

Events → Extraction（提取） → Consolidation（整合去重） → Knowledge↓Reflection（跨场景反思，仅 Episodic）

关键设计决策：

异步处理：不阻塞对话流程，20-40 秒后台完成
语义去重：基于向量相似度判断是否为同一事实的不同表述
冲突解决：时间戳较新的信息自动覆盖旧信息
检索机制：语义搜索，约 200ms 延迟

四种内置策略的实现分析

1. Semantic Memory

目标：提取离散的事实性信息

处理流程：Extraction + Consolidation

Extraction 阶段从对话中识别实体和关系（NER + RE 的 LLM 实现）
Consolidation 阶段将新事实与已有知识比对，语义重复则合并，冲突则以新替旧

数据结构：每条记忆是一个独立的 fact triple（主体-属性-值）

2. User Preference Memory

目标：追踪用户偏好的演化

处理流程：Extraction + Consolidation

输出结构化字段：context（场景）、preference（偏好内容）、categories（分类标签）
与 Semantic Memory 的区别：偏好不是简单覆盖，而是按 context 维度独立存储

工程意义：支持"技术文档要详细，日常对话要简洁"这种场景化偏好

3. Summary Memory

目标：长对话的增量压缩

处理流程：仅 Consolidation

不做 Extraction，直接对整个对话做增量摘要
类似 MapReduce 的 reduce 阶段——新对话内容与已有摘要合并

适用场景：对话轮次多但不需要精细事实提取的场景

4. Episodic Memory

目标：从完整交互经验中学习

处理流程：Extraction + Consolidation + Reflection

Extraction：自动识别 episode 边界（一个有意义的交互片段，比如"遇到错误→尝试修复→成功"）
Consolidation：将 episode 压缩为结构化记录
Reflection：跨多个 episode 分析规律，生成 meta-knowledge

Namespace 设计：

episode:    /strategy/{id}/actor/{actorId}/session/{sessionId}/
reflection: /strategy/{id}/actor/{actorId}/

episode 按会话粒度，reflection 按用户粒度。这意味着一个用户跨多个会话的经验可以被统一反思。

扩展机制

三个层次的扩展能力：

层次	说明	适用场景
Built-in	全自动，零代码	大多数场景
Built-in with Overrides	追加 prompt、换模型	需要领域定制
Self-managed	完全自主管线	需要集成外部系统

Overrides 示例——追加领域指令：

{"strategy_type": "SEMANTIC","overrides": {"append_to_prompt": "重点提取电商订单相关事实：SKU、数量、价格","model_id": "anthropic.claude-3-haiku-20240307-v1:0"}
}

工程 Trade-off

延迟：长期记忆写入 20-40s，读取 200ms。适合非实时场景
策略选择：Semantic 适合结构化事实，Episodic 适合经验学习，两者互补
成本：每次 Extraction/Consolidation 都需要 LLM 调用，strategy 越多成本越高
一致性：短期记忆强一致，长期记忆最终一致（异步处理窗口内可能读到旧数据）

总结

AgentCore Memory 的架构设计回答了一个核心问题：怎么让 Agent 的记忆像人一样——记住重要的、更新变化的、忘掉冗余的、从经验中学习。

双层存储实现了原始数据和知识的分离，四种策略覆盖了事实、偏好、摘要和经验四个维度，三层扩展机制兼顾了开箱即用和深度定制。

对于构建需要持续交互的 Agent 系统，这是目前比较完整的记忆管理参考架构。

Amazon Bedrock：https://aws.amazon.com/cn/bedrock/
Amazon Bedrock AgentCore：https://aws.amazon.com/cn/bedrock/agentcore/
AgentCore Memory 文档：https://docs.aws.amazon.com/bedrock/latest/userguide/agentcore-memory.html

查看全文

http://www.jsqmd.com/news/485789/