当前位置: 首页 > news >正文

使用 OceanBase seekdb 为 AI Agent 实现持久化记忆:从全量上下文到精准召回

摘要:

本文介绍如何使用 seekdb-js SDK + Qwen3 Max (via OpenRouter) 为 Node.js AI Agent 实现高效的向量记忆系统。系统支持固定数量、阈值及混合召回策略,显著降低token消耗与响应延迟,并提供完整代码实现。

 

完整代码仓库: https://github.com/kejun/seekdb-agent-memory

 

问题背景:为什么传统记忆方案效率低下?

 

在使用 LangGraph 或自定义 AI Agent 时,持久化记忆是一个核心需求。然而,传统的记忆方案存在一个明显的效率问题:它总是将全部历史消息作为上下文传递给 LLM,即使这些消息与当前问题毫不相关。

 

举个例子:当你只是向 Agent 问候一句"你好"时,系统却会把过去 50 轮对话的所有内容都塞进 Prompt。这些冗余信息不仅浪费Token,还可能干扰模型的回答质量。

 

实际后果:

 

Token 成本飙升(实测可达实际需求的 10-20 倍)

响应延迟增加

模型注意力分散,回答质量下降

 

seekdb 的解决方案:将消息存储为向量嵌入(Embedding Vectors),通过向量相似度搜索,只召回与当前问题最相关的历史消息。

 

核心概念解析

 

1. 什么是嵌入向量(Embedding Vectors)?

 

计算机无法理解人类语言,它只能处理数字。嵌入向量将文字转换为数值列表,捕捉语义信息。

 

例如:"我喜欢看 AI 教程" → [0.12, -0.45, 0.88, ...]

Qwen3 Embedding 8B 生成 4096 维向量(注意:不是 1024 维)

语义相似的句子,其向量在多维空间中距离更近

 

2. 向量相似度搜索

 

直接问计算机 "我喜欢看 AI 教程" 和 "我爱看 YouTube AI 视频" 是否相似,它无法回答。但如果比较它们的嵌入向量,计算机就能计算出确定的相似度分数。

 

seekdb 的优势:

 

基于 OceanBase,支持大规模向量数据

原生支持向量存储和相似度搜索

比 PostgreSQL + PGVector 更易部署

 

3. 距离函数与余弦相似度

 

seekdb 支持多种距离计算方式:

 

余弦相似度(Cosine Similarity):最常用,范围 [-1, 1]

欧几里得距离(L2 Distance):向量空间直线距离

 

关键公式:


1

 

 

余弦相似度取值含义:

1.0:完全相似(0°夹角)

0.0:无关(90°夹角)

实践中,> 0.7 通常表示高相关

 

技术选型

 

Qwen3 Max + Qwen3 Embedding

 

2

 

 

两种召回策略对比

 

策略一:固定数量召回(Limit-based)

 

始终返回最相似的 N 条历史消息。

适用场景:成本敏感型应用,需要可预测的 Token 成本。

 

策略二:阈值召回(Threshold-based)

 

只返回相似度超过阈值的消息(如 ≥ 0.75)。

适用场景:追求回答质量,愿意接受动态上下文长度。

 

策略三:混合召回(推荐)

 

先阈值筛选,再限制数量。兼顾质量和可控性。

 

完整实现代码

 

以下代码来自实际仓库:https://github.com/kejun/seekdb-agent-memory

 

1. 安装依赖

 

3

 

 

2. 环境变量配置(.env)

 

4

 

 

3. 数据库连接配置

 

5

 

 

4. 核心记忆管理类

 

6

 

 

5. 智能 Agent 示例

 

7

 

 

关键特性:角色过滤

 

在实际应用中,我们通常只关心用户自己说过的话,而不是 Agent 的回复。通过 role 参数可以实现这一点:

 

8

 

 

这在处理个人信息查询时特别有用,可以避免召回 Agent 的礼貌回复等无关内容。

 

效果对比

 

9

 

 

总结

 

核心洞察:

 

  1. 记忆的关键不在"存多少",而在"召回准不准"
  2. 向量相似度搜索是语义记忆的终极方案
  3. 根据查询类型动态选择召回策略效果更佳

 

技术栈组合:

 

Vector DB: seekdb (OceanBase)

LLM: Qwen3 Max via OpenRouter

Embedding: Qwen3 Embedding 8B (4096维)

 

完整代码: https://github.com/kejun/seekdb-agent-memory

http://www.jsqmd.com/news/417293/

相关文章:

  • 2026年崖舍民宿/酒店推荐:蝶舞清江地心谷,玻璃/地心/热门崖舍全系体验 - 品牌推荐官
  • 2026年沐浴露品牌推荐:基于多场景实测评价,针对肤质适配与留香痛点精准指南 - 十大品牌推荐
  • 定稿前必看!降AI率软件 千笔AI VS 万方智搜AI,专为本科生打造!
  • MATLAB中基于领航追随法的车辆编队控制及与人工势场法融合实现避障
  • 运算放大器前面的电压跟随器的作用是什么
  • 直接上结论:研究生必备的AI论文软件 —— 千笔·专业学术智能体
  • 模拟人生:小县城的计算机类公务员安逸的一生
  • 将AnythingLLM连接到亮数据MCP服务器
  • 企业微信私域流量主动触达的高阶工具
  • 从数据采集到智能决策:SCADA系统研发如何重塑工业控制未来?
  • 如何利用 RPA 实现企业微信外部群批量喊话
  • 智慧农业各种农作物叶子病害检测数据集VOC+YOLO格式9845张86类别
  • 专科生也能用!抢手爆款的AI论文软件 —— 千笔写作工具
  • 【2026-02-12】连岳摘抄
  • GeoServer CVE-2025-58360 XXE漏洞深度剖析:从攻击利用到防御策略
  • 高校机房空调及环境监控管理系统方案
  • 高速湿法制粒机厂家哪家好?设备稳定可靠吗?怎么选才放心? - 品牌推荐大师
  • OpenClaw系列-在Rocky Linux 部署Ollama
  • 【2026-02-13】连岳摘抄
  • 川内茶楼装修哪家强?拒绝踩雷,这份“五强榜单”请收好! - 深度智识库
  • 如何高效使用银泰百货卡?线上回收教程全解析 - 团团收购物卡回收
  • Solutions P1843 奶牛晒衣服
  • 2026国产显微高光谱成像仪哪个品牌更好?解析性价比与质量 - 品牌推荐大师
  • 2026 高原制氧设备优选名单 五家实力企业适配不同缺氧场景 - 深度智识库
  • 2026域名中介平台推荐:靠谱交易渠道全解析
  • 2026年红外热像仪厂商推荐,细聊产品性能哪家优 - 工业设备
  • 2026年海南睿臻领航实力解读,人才落户权威合作案例丰富 - mypinpai
  • 流化床制粒干燥包衣机哪家服务好?效率真的高吗?品牌怎么选? - 品牌推荐大师
  • 如何破解展厅“设计与施工脱节”?川渝5家一体化公司推荐 - 深度智识库
  • 2026年国内户外车载制氧机品牌排行榜:高原旅行与长途自驾最佳选择 - 深度智识库