当前位置: 首页 > news >正文

δ - mem:提升大型语言模型内存效率,得分最高可达 1.31 倍!

快速通道

可了解 arXiv 成为独立非营利组织的情况,也能直达康奈尔大学官网。同时,还能通过链接进行捐赠,支持 arXiv 的发展。

搜索与导航

提供了多种搜索途径,可在所有字段(标题、作者、摘要等)进行搜索。还有快速链接,如登录、查看帮助页面和了解关于 arXiv 的信息。

论文详情

在计算机科学 - 人工智能领域,有一篇名为 $δ$-mem:大型语言模型的高效在线内存 的论文(arXiv:2605.12357)。该论文于 2026 年 5 月 12 日提交,作者有雷景迪、张迪等 10 人。

论文亮点

在长期助手和智能体系统中,大型语言模型积累和复用历史信息需求增大,但单纯扩大上下文窗口成本高且效果不佳。$δ$-mem 作为轻量级内存机制,通过紧凑的在线关联内存状态增强固定的全注意力主干网络。它将过去信息压缩成固定大小的状态矩阵并更新,在生成过程中对主干网络的注意力计算进行低秩校正。仅用一个 $8×8$ 的在线内存状态,$δ$-mem 就能将平均得分提高到固定主干网络的 1.10 倍,非 $δ$-mem 最强内存基线的 1.15 倍。在对内存要求较高的基准测试中提升更大,在 MemoryAgentBench 上达到 1.31 倍,在 LoCoMo 上达到 1.20 倍,还保留了通用能力。

论文相关信息

学科分类为人工智能 (cs.AI) ,有具体的引用格式。提交历史显示来自雷景迪,于 2026 年 5 月 12 日提交 v1 版本。可查看论文的 PDF 版本和 TeX 源代码,还能了解论文的许可信息。

浏览与参考

当前浏览上下文为计算机科学 - 人工智能,可进行上一篇、下一篇文章的切换,也能查看最新、近期文章。还提供了多种参考文献与引用工具,如 NASA ADS、谷歌学术等。

其他相关资源

涵盖代码、数据和媒体相关的切换选项,如 alphaXiv、CatalyzeX 等。还有演示相关的切换,如复制、空间等。此外,有推荐器和搜索工具,如影响力花、CORE 推荐器等。

关于 arXivLabs

arXivLabs 是允许合作伙伴在 arXiv 网站开发和共享新功能的框架。与 arXivLabs 合作的个人和组织需认同并接受开放、社区、卓越和用户数据隐私价值观。若有能为 arXiv 社区增值的项目想法,可了解更多关于 arXivLabs 的信息。同时,还提供了关于 arXiv 的多方面信息,如联系 arXiv、订阅邮件列表等。

http://www.jsqmd.com/news/833933/

相关文章:

  • 3DS游戏格式转换神器:5分钟让.3ds文件变身为可安装的CIA
  • Arm Neoverse CMN-700互连架构与协议寄存器配置指南
  • 告别混乱!用Git Flow规范你的GitLab团队项目提交流程(Mac环境实战)
  • Godot引擎集成深度强化学习:从原理到实战训练游戏AI
  • Git 分支管理的基本操作步骤有哪些?
  • 别再死记硬背了!用Python模拟5G AMC双环控制,搞懂CQI、MCS、HARQ如何联动
  • 干货指南:合规消字号护理产品OEM工厂费用解析 - mypinpai
  • nicepkg/aide:开箱即用的现代前端构建集成方案
  • 如何彻底解决虚幻引擎Pak文件的“黑盒“问题:UnrealPakViewer深度指南
  • Windows Defender移除工具:模块化系统安全组件管理方案
  • 保姆级指南:在华为Atlas800(AArch64架构)上为Anaconda配置完整的昇腾AI开发环境
  • SmarterRouter:基于软件定义与模块化构建智能路由器系统
  • AD15原理图编译警告全解析:从LM358到MOS管,手把手教你忽略还是修复
  • NS-USBLoader:终极Switch游戏管理工具 - 如何简化你的游戏安装流程
  • 突发!OpenAI大规模重组,ChatGPT之父被调离,IPO前夕大动荡!
  • 基于Claude与Composio构建开源AI编程代理:OpenClaw架构解析与实践
  • 5分钟搞定PCL2启动器Java配置错误的完整解决方案
  • 计算机科学第三难题:“树映射”问题在文件、写作、建筑、生物分类中无处不在!
  • 从API密钥管理到安全代理:构建企业级AI应用接入方案
  • 避坑指南:STM32G4 CORDIC模块的Q31格式转换与DMA模式的那些‘坑’
  • 从单体到集群:OpenAI Agent Swarm架构解析与多智能体协作实践
  • Hitboxer终极指南:专业级游戏键盘重映射与SOCD清理工具完全教程
  • 大模型智能体Token优化实战:四层防御体系降低AI应用成本
  • 如何打破输入法壁垒:深蓝词库转换终极指南
  • 基于OneBot标准的聊天机器人增强框架openclaw-onebot深度解析
  • DeepSeek-V4-Flash 登场,大语言模型引导技术再引关注!
  • ArcGIS地质图矢量化避坑指南:从配准误差到拓扑关系,我踩过的雷你别踩
  • 3分钟掌握Rhino.Inside.Revit:打破BIM与参数化设计壁垒的终极指南
  • AI如何量化科学品味?多模态GNN与对比学习在科研评估中的应用
  • 终极指南:如何快速下载网易云音乐双语歌词并适配Walkman设备