当前位置: 首页 > news >正文

TencentDB Agent Memory 正式开源:让 Agent 沉淀经验,让人专注创造

今天,腾讯云数据库团队正式开源 TencentDB Agent Memory。

一套面向 AI Agent 的分层记忆引擎,项目采用 MIT 协议开源,开箱即用。

项目主页:https://github.com/Tencent/TencentDB-Agent-Memory

在当前主流的 Agent 架构中,Memory 已经从"加分项"变成了"标配组件"。

无论是面向 C 端的对话助手,还是面向开发者的长周期 Agent,底层都依赖类似的"记忆层"承

载跨会话偏好与历史经验,并逐渐收敛出一套通用的接口范式。

TencentDB Agent Memory 正是在这一背景下诞生的:让 Agent 学会你的工作流程、保留任务上下文、复用历史经验——以符号化记忆化解单次长任务的信息过载,以分层记忆沉淀跨会话的经验资产。

在超长 session 评测中发现,Agent Memory 作为 OpenClaw 插件接入后:最高节省 61.38% Token,通过率相对提升 51.52%;PersonaMem 准确率从 48% 提升到 76%。

记忆能力BenchmarkOpenclaw 成功率加插件后成功率相对变化Openclaw Token 消耗加插件后 Token 消耗相对变化
短期记忆WideSearch33%50%51.52%221.31M85.64M−61.38%
短期记忆SWE-bench58.40%64.20%9.93%3474.1M2375.4M−33.09%
短期记忆AA-LCR44.00%47.50%7.95%112.0M77.3M−30.98%
长期记忆PersonaMem48%76%59%

目前,TencentDB Agent Memory 已作为 OpenClaw 记忆增强插件,在生产环境中验证效果。

01

准确

当下主流 AI Agent 的记忆方案,大多做的是同一件事:把对话历史压缩成一段摘要,然后在下次会话时注入上下文。这在短对话里够用,但在真实的长周期任务中会暴露三个问题:

● 跨会话断裂:昨天反复确认的代码规范,今天新开会话又全忘了

● 事实与偏好混淆:用户说过"我用 TypeScript"和"帮我查一下天气",这两条信息的价值完全不同,但被同等对待

● 上下文膨胀:任务越长,堆进上下文的历史信息越多,Token 消耗持续攀升,模型注意力也在衰减

TencentDB Agent Memory 通过把不同粒度的信息放在不同的"楼层",构建分层式长期记忆能力来解决以上长周期任务问题:

L0 原始对话层全量保留每一轮交互;

L1 原子记忆层自动提取事实、偏好、约束、阶段结论;

L2 场景归纳层按任务自动聚合;

L3 用户画像层持续蒸馏出稳定的长期画像

每一层只做一件事,层与层之间通过提取-聚合-蒸馏的管道连接,任何一层都可以独立升级或替换,让Agent 不再因为换了一次会话就忘掉你是谁。

02

效率

过去,"更聪明的 Agent"往往意味着"更贵的 Agent",但 Agent 是按 Token 计费、按响应速度评价的,每多塞一段对话,就是成本和体验的双重损失。

TencentDB Agent Memory 通过上下文卸载 + Mermaid 无限画布两项关键技术,把原始工具结果搬到外部文件,把任务结构折叠成可导航的画布,上下文里只保留摘要和索引。

对于连续任务和大规模并发,每一个 Token 都影响着成本和体验,这套功能,使得原文不丢、结构可查、Token 不再线性增长。

03

稳定

省 Token 之外,任务完成率也是检验记忆方案的重要指标。

很多压缩方案能把 Token 砍下来,但任务跑偏、遗忘、重复分析的问题随之而来。

TencentDB Agent Memory 在四个公开评测集上同时跑通了两条曲线:Token 下降,完成率上升。

不过,「跑得稳」不只看评测分数,还得经得起底层架构的拷问——我们用 异构存储 + 全链路可溯源,确保了稳定与全量检索。

这套能力已在生产环境经历真实验证——在编程、调研、文档分析、工作流编排四类长链路任务上稳定收敛。

04

快速开始

GitHub 仓库中提供了 OpenClaw 、Hermes Gateway 接入方案,开箱即跑。

1.Openclaw 一行安装

openclaw plugins install @tencentdb-agent-memory/memory-tencentdb openclaw gateway restart

2. Hermes Gateway(Docker,需版本号 ≥ 0.3.4)

除 OpenClaw 外,本插件也支持 Hermes Agent。(https://github.com/NousResearch/hermes-agent)

一行命令即可启动带记忆能力的 Hermes:

dockerrun-d\ --name hermes-memory \ --restart unless-stopped \ -p8420:8420\ -eMODEL_API_KEY="$MODEL_API_KEY"\ -eMODEL_BASE_URL="$MODEL_BASE_URL"\ -eMODEL_NAME="$MODEL_NAME"\ -eMODEL_PROVIDER="$MODEL_PROVIDER"\ -vhermes_data:/opt/data\ agentmemory/hermes-memory:latest

镜像支持 linux/amd64 和 linux/arm64。内置腾讯云 DeepSeek-V3.2 默认配置,如需自定义模型可额外传入 MODEL_BASE_URL、MODEL_NAME、MODEL_PROVIDER。

验证:

curlhttp://localhost:8420/health# 检查 Gateway 状态 dockerexec-ithermes-memoryhermes# 进入 Hermes 对话

记忆不是让 AI 记住所有事,而是让人不必重复所有事。

我们把 TencentDB Agent Memory 放到开源社区,是因为相信记忆这个产品远没有标准答案,比起做一个完美的方案,我们更想和开发者一起,把产品做得更丰富、更扎实、更可用,从而帮助更多 Agent 沉淀经验,让人更专注于创造。

欢迎所有形式的共建——提一个 issue,发起一次discussion,对一个早期项目而言,每一种反馈,都是贡献。

05

相关链接

资源链接
GitHubhttps://github.com/Tencent/TencentDB-Agent-Memory
npmhttps://www.npmjs.com/package/@tencentdb-agent-memory/memory-tencentdb
官网介绍

https://cloud.tencent.com/product/agm

PersonaMem 评测集https://github.com/bowen-upenn/PersonaMem
OpenClawhttps://github.com/openclaw/openclaw
HermesGitHub - NousResearch/hermes-agent: The agent that grows with you · GitHub

TencentDB Agent Memory 由腾讯云数据库团队开发和维护。如果这个项目对你有帮助,欢迎在 GitHub 上给一个 ⭐。

http://www.jsqmd.com/news/830375/

相关文章:

  • 面向图形引擎的C++组件系统设计
  • 在企业内部搭建AI服务中台如何利用Taotoken进行统一纳管
  • AMD Ryzen SDT调试工具:三步完成专业级处理器性能调优
  • 运算放大器增益带宽积(GBW)计算指南:从原理到选型实战
  • 3个核心优势:Open-Meteo如何用开源技术重构天气API的经济学模型
  • 从入门到精通:2026年最新漫反射光电开关PR18-TM10DNO选型攻略 - 新闻快传
  • T2080工控主板开发实战:从核心特性到系统部署全解析
  • 咸鱼大量流出惠普Z2 G9工作站迷你主机准系统,支持12-14代处理器,双M2固态硬盘,还支持双槽半高卡,须搭配DDR5内存!
  • 超越基础设置:用Lumerical脚本高效管理FDTD仿真中的多个监视器(Monitor)
  • 【职场】职场里,毁掉你的往往不是懒惰,而是错误的勤奋
  • AI提示词工程实战:从Awesome-Prompts到个人效率系统构建
  • C++中的不可变对象设计与线程安全收益
  • 通过Taotoken控制台精细化管理每日API用量与团队权限
  • 企业如何选择合适的智能客服系统?关键考量因素全解析 - 品牌2025
  • WinUtil:Windows系统优化与软件管理的终极免费解决方案
  • AI智能体开发脚手架:从零到一构建自主任务执行系统
  • imgaug实战:从基础图像增强到关键点与边界框的完整数据流水线
  • Plasmic可视化开发平台:低代码建站与React组件化融合实践
  • ElevenLabs奥里亚文语音技术白皮书(印度东部市场准入关键凭证)
  • AI赋能智能网关:构建动态安全防线与访问控制实践
  • 初次接触大模型API,通过Taotoken快速上手指南
  • 开源商业技能知识库:结构化沉淀实战方法论
  • 别再纠结用哪个了!Flink Table API 与 DataStream API 混搭实战指南(附避坑经验)
  • ARM架构计数器与定时器虚拟化技术详解
  • AI提示词工程化:Git仓库管理、版本控制与团队协作实战
  • 面向低延迟系统的C++时间处理优化
  • 告别环境配置噩梦:手把手教你用Anaconda在Win10上搞定MPE与MADDPG(附版本避坑清单)
  • 从原理到代码:拆解Apollo激光雷达运动补偿中的“显著旋转”判断与SLERP插值
  • 【职场】职场里,你以为的“情商高“,其实是在免费出血
  • 如何用Diablo Edit2轻松管理暗黑破坏神2角色存档:新手完全指南