当前位置: 首页 > news >正文

Agent-memory-摘要评估中的覆盖率以及可用性

随着记忆的增加,如果不对记忆进行压缩形成摘要,那么检索的速度只会越来越慢,假设记忆库中有10条记忆时,检索的时间是10ms,那么增加到110条时,检索时间大概就是110ms,而在实际的使用中,记忆库动辄就会达到几十万几百万的量级,要是真的这么慢,那agent也不会有人用了。

关键点与关键词

在用代码实现摘要的过程中,有一些可能会令人混淆的概念,记忆摘要生成时的关键点以及摘要质量评估时的关键词。这两个听起来差不多,但是实际的逻辑却完全不一样。前者是agent用聚合原理,将相同主题或者相同会话的记忆聚合为一个个簇,每个簇摘要形成内容、来源、压缩率,关键点和时间。这里的关键点是LLM根据记忆内容提取出来的关键点,比如做了数据报告,学习了数据分析等。

而摘要质量评估中的关键词,主要是用在评测摘要对于来源中记忆的覆盖率检测。这里的关键词是我们在学习RAG中粗排的关键词匹配,是直接分词后做的关键词提取,防止摘要过于抽象而忽略一些细节,比如摘要里说浪费了大量token,但是这个给人的感觉,其实是可以在接受范围里的,无非就是成本大一点,但是如果换成几十万token,那这就是一场事故了,需要引起重视。

可用性

在质量评估中,通过检查摘要形成的长度来判断可用性,通俗点说就是形成的摘要要适中一些。这听起来有点反直觉,因为从字面理解,可用性应该是在后续的检索召回中对用户提问来说有没有用。

但实际上,这个是从形成摘要的出发点来理解的。我们一开始想要形成摘要不是为了更便捷地储存信息,毕竟,除了检索速度变慢以外,无论是什么形式的压缩,都会或多或少地丢失信息。所以最直观的就是,要减少记忆所花的空间的同时保留有用信息。那么长度其实就能透露这个重要的细节,太短的摘要,不管怎么概括,怎么浓缩,受到篇幅的限制,怎么都做不到完美,就像限定了只能用一百个字来概括一份报告,就是会比四百字的概括少很多细节。而比较长的摘要,在检索召回时又会挤占很多上下文窗口,还是会降低很多检索速度,既然如此那还不如不压缩。

http://www.jsqmd.com/news/731452/

相关文章:

  • 如何用抖音下载工具高效管理内容创作?实用指南全解析
  • B站视频缓存转换终极指南:5分钟掌握永久保存技巧 [特殊字符]
  • 高效GitHub加速插件:全面解析与实战应用指南
  • 保姆级教程:在Ubuntu服务器上配置Jupyter Lab,实现手机远程写Python代码
  • 从设计思路到硬件映射:我是如何利用7系列FPGA的SLICEM玩转分布式RAM和移位寄存器的
  • 使用 Python 快速接入 Taotoken 并调用 OpenAI 兼容大模型
  • 好帅(HOST) HS-AF01T电烤炉(空气炸锅)的小修及物联网设备的安全思考
  • 别再暴力搜索了!用PCL的KD-Tree和Octree搞定点云近邻查找(附C++实战代码)
  • KLayout版图设计工具终极指南:从零到精通的完整学习路径
  • 深入解析Dell G15散热控制:tcc-g15开源方案架构与实战指南
  • 鸣潮自动化工具完全指南:5步实现游戏时间解放的智能方案
  • 开源TinyUSB vs 厂商SDK:在ESP32-S3上做USB主机,我为什么选择了它?
  • ComfyUI-AnimateDiff-Evolved:5种高级架构设计实现专业级动画生成
  • Spliit开源项目解析:费用分摊算法与全栈技术实现
  • 具身智能(Embodied AI):当 Agent 走进物理机器人
  • 通过curl命令直接测试Taotoken聊天补全接口
  • JetBrains IDE试用期重置终极指南:30天无限续杯完整教程
  • VisualCppRedist AIO:一站式解决Windows运行库兼容性难题的专业级方案
  • 2026年胰岛素泵深度评测与选购指南:AI赋能,控糖更具温度 - 速递信息
  • 汽车ECU休眠唤醒那些事:从TJA1021的INH引脚到AUTOSAR LinTrcv的实战设计
  • 半导体测试数据可视化利器:STDF-Viewer全面解析
  • HunterPie终极指南:免费开源的《怪物猎人世界》叠加层工具
  • 逆向工程Claude代码生成:从黑盒测试到高效提示工程实战
  • 运维转网安必读:合规知识+技术能力,打造你的核心竞争力(收藏起来慢慢学)
  • Mysql数据库查询结果转JSON
  • 2026年3月评价好的公交广告公司推荐,广播电台广告/上海花旗大厦广告/地铁广告,公交广告公司承包商联系电话 - 品牌推荐师
  • 从Bode图到参数调优:手把手教你用MATLAB搞定准PR控制器设计
  • 如何在 Python 中快速接入 Taotoken 并调用 OpenAI 兼容 API
  • 2026全年天津滨海新区婚姻家事律所口碑测评,专业靠谱之选汇总 - 速递信息
  • Kodi字幕插件终极指南:3分钟搞定影视字幕下载难题