当前位置: 首页 > news >正文

INMS: Memory Sharing for Large Language Model based Agents 论文笔记

背景

现有的 memory 工作主要都关注 Agent 独立利用自身存储的记忆来完成任务,这种孤立的范式忽视了 Agents 间的互动和集体记忆的巨大潜力。当前方法常常未能模拟复杂多代理环境中自然发生的异步对话和知识交流,忽视了拥有独特对话历史和专业培训的 Agents 之间的固有多样性和互补性

因此本文提出了 INMS 框架,将范式从孤立推理转变为隐式且高效的异步对话机制。通过互动学习促进动态记忆共享,INMS 建立了一个无需依赖外部静态数据库的共享对话场地

方法

image-20260329111849712

(1) 记忆生成与选择

记忆本质上是 Prompt-Answer 对(PA pair),每次交互后,对于每个新生成的记忆,LLM 评分器会给它进行评分并决定是否将其加入共享记忆池

首先使用 LLM 查询以获取各种评分标准,然后再用 LLM 评估提取最合理的评分标准,经过人工审核后最终确定。每个新生成的记忆将与相应评分标准合并并提交给 LLM 评分器。如果 PA pair 的分数超过预设阈值,答案及其对应提示会被打包为有用内存并存储在内存中

(2) 记忆检索与训练

  • 记忆检索:会有一小部分实例被手动归档到记忆池中用于初始化,在回答阶段,Agent 利用密集向量相似度检索的方式从共享记忆池中提取记忆。这些提取的记忆与问题结合,形成一个 prompt 提交给 Agent

  • 记忆训练:每当新的 PA pair 加入记忆池,会使用 BM25 确定最相关的 n 个候选对,然后利用 LLM 给候选对中的输出与新记忆输出相矛盾的概率打分(类似于对话交互机制)。获得的标记数据用于最小化设计的损失函数

(3) 交互式学习

本文说通过评分识别出的高质量 PA pair 被添加到记忆池中,从而加速记忆增长和 Agents 自我增强

实验

(1) 共享记忆的表现

image-20260329122110231

在所有任务中,与不使用共享记忆相比,所有智能体的性能都有显著提升。这表明,来自其他任务的可共享记忆可以帮助智能体获得期望的答案,而不是干扰智能体的学习能力

(2) 跨域共享记忆的表现

image-20260329122622558

作者还构建了一个额外的存储池——集成存储池,将所有域中所有智能体的可共享记忆合并到一个存储池中。然而,如图所示,尽管集成池可以增强共享记忆的多样性,但领域特定池更有效地使智能体能够生成可靠的答案

(3) 演化机制的表现

image-20260329123332207

在设定不同比例的有偏见数据进行初始化后,尽管最初的偏见池严重干扰了代理在早期互动中的反应(因为他们反复检索并参考有缺陷的例子),但不断涌入的动态过滤记忆逐渐稀释了这种偏见。因此最终智能体的表现反弹,最终接近无偏情景中观察到的峰值分数

总结

是一篇对多智能体共享记忆很好的研究工作,提出了一种共享记忆的高质量演化方法

http://www.jsqmd.com/news/554623/

相关文章:

  • InternLM2-Chat-1.8B在复杂网络问题诊断中的辅助应用
  • 显卡性能调优:从系统瓶颈到高效GPU资源分配的完整指南
  • bilibili-api用户认证详解:SESSDATA、BILI_JCT、BUVID3等参数获取全攻略
  • 内存故障排查终极指南:Memtest86+从入门到精通
  • GPU显存暴涨300%却查不到泄漏点?Cuvil IR可视化调试器首次公开:3分钟定位Python模型编译期内存幻影引用
  • BERT实践指南:从理论到应用的自然语言处理技术
  • VS2022 Fortran 集成IMSL库实战指南
  • BERT终极使用指南:5分钟掌握自然语言处理核心技术
  • 浙江BWT倍世家用净水器性价比高吗,值得推荐吗 - 工业推荐榜
  • 毕设程序java高校辅导员工作管理系统 基于SpringBoot的高校学生事务协同管理平台设计与实现 基于Java的高校学工一体化服务系统开发与应用
  • ai+实现pytest框架讲解(2)
  • 总结全国好用的多元素分析仪品牌,哪家值得推荐? - mypinpai
  • 3.29
  • Win11+VS2022下Ceres库安装全攻略:从源码编译到避坑指南
  • Fun-ASR语音识别新手入门:环境配置+Web服务启动,10分钟搞定
  • 资源下载器:突破平台限制的全场景网络资源获取解决方案
  • # 发散创新:用 Rust构建高性能 Web3.0 智能合约验证器
  • 组合式API如何重塑Vue管理系统开发?探索3大架构升级与实践路径
  • 2026年广西云南等地防潮通信设备工厂排名,这些品牌值得关注 - myqiye
  • oii一键生成动漫,oiioii一键生成动漫,oii邀请码,oiioii邀请码2026年3月29日最新
  • 告别对账烦恼:用SAP COPA深度拆解生产成本9大差异与销售成本
  • # 发散创新:用 Locust 实现高并发压力测试的实战进阶指南在现代分布式系统中,**性能瓶颈往往隐藏在看似稳定的接口背后**。
  • Nunchaku-flux-1-devWebUI国产化适配:麒麟V10+统信UOS操作系统兼容性验证
  • 环视摄像头系统避坑指南:常见标定问题与动态辅助线精度优化
  • Web技术栈全解析:构建Qwen3智能字幕对齐系统管理后台
  • 建设项目筹备:2026年专业可行性研究报告服务参考,大健康产业规划/景观规划与设计,可行性研究报告代写公司有哪些 - 品牌推荐师
  • 2026年上海地区口碑好的纹理美观的进口岩板品牌推荐,专业定制企业全解析 - 工业设备
  • 如何高效配置RedisInsight:Redis可视化管理的完整专业指南
  • 2026年木百叶供货商家推荐,性价比高的是哪些 - 工业品网
  • 圣女司幼幽-造相Z-Turbo环境部署详解:Anaconda虚拟环境管理