感觉2026年将是Agent Memory元年...
小龙虾的爆火意味着AI正在进入下半场,从前卷智能对话,现在得看agent能不能帮你把事做完,而这个重点就在于memory。
很显然,今年的agent memory已经是大模型Agent的必争之地,跨session累积、跨任务复用、攻防对抗全在这一层打,而这三块也是这方向最核心、最活跃、论文/创业/大厂全扎堆的热点。
就性价比而言,简单事实存储架构,加上足够强的模型和多轮agent交互,就能解决绝大多数问题,这方向入门门槛很低了,也容易落地。
为方便大家快速跟进前沿、把握行业风口,本文整理了15 篇Agent Memory相关论文+代码,全是顶会成果,如果还在纠结记忆设计、长程交互闭环等问题,不妨试试吃透这些文章,相信很快能有思路。
全部论文+开源代码需要的同学看文末
【CVPR 2026】VideoARM: Agentic Reasoning over Hierarchical Memory for Long-Form Video Understanding
研究方法:本文提出VideoARM,依托Agent结合分层多模态记忆HM³,通过观测-思考-行动-记忆的迭代循环、由粗到细调用工具完成长视频理解,摒弃静态预处理,大幅降低token消耗并提升推理效果。
创新点:
构建分层多模态记忆HM³,分为感知、结果、工作三层存储不同维度信息,随智能体推理动态更新,持续留存视频多层级线索。
设计由粗到细的双工具集,结合时序范围划定与多模态内容解析工具,实现自适应按需探查,避免冗余运算。
采用观测-思考-行动-记忆的智能体迭代推理范式,取代传统静态预处理与固定检索模式,显著减少token占用。
研究价值:研究提出的VideoARM框架结合智能体推理与分层多模态记忆,在多项主流长视频理解基准上取得最优性能,同时大幅削减Token消耗,为高效处理长时序视频内容提供了实用且性能优异的新方案。
【ICML 2026】Learning Query-Aware Budget-Tier Routing for Runtime Agent Memory
研究方法:本文提出BudgetMem框架,面向大模型智能体的运行时记忆,采用模块化流水线搭配三级预算档位,并通过强化学习训练轻量级路由器实现查询感知的记忆预算路由,灵活权衡记忆推理的效果与开销。
创新点:
摒弃传统离线记忆构建方式,采用运行时按需提取的智能体记忆范式,避免与查询无关的冗余预处理。
将记忆处理拆分为独立模块,并为每个模块设置低/中/高三档预算档位,从多维度实现算力精细调控。
基于强化学习训练轻量级路由器,依据查询和中间状态动态选择模块档位,实现效果与成本的可控权衡。
研究价值:研究提出的 BudgetMem 框架实现了智能体运行时记忆的精细化算力管控,不仅在多项评测任务上取得优异表现,还系统剖析了不同预算策略的优劣与适用场景,为资源受限环境下大模型智能体记忆系统的部署与优化提供了实用参考。
关注下方《学姐带你玩AI》🚀🚀🚀
回复“222”获取全部方案+开源代码
码字不易,欢迎大家点赞评论收藏
