当前位置: 首页 > news >正文

智能体的记忆管理机制及其潜在风险 | 直播预约

主题

智能体的记忆管理机制及其潜在风险

时间

2025.12.30 周一 11:00 北京时间
2025.12.29 周日 22:00 美东时间
2025.12.29 周日 19:00 美西时间

直播平台

微信视频号:

b站直播间:

Youtube直播间:

https://www.youtube.com/live/U0rDRX7ZkYM

内容介绍

分享简介:大语言模型(LLM)智能体的兴起标志着人工智能从静态模型向具备感知、推理与行动能力的自主系统的根本性转变。记忆机制是此类智能体的核心组成部分,使其能够保留过往经验并适应新的任务需求。本次报告将探讨记忆管理如何从根本上影响大语言模型智能体的性能,并揭示记忆机制所伴随的潜在风险。

通过系统性的实证研究,我将展示合理的记忆管理策略如何有效缓解智能体记忆中的两大关键挑战:错误传播(error propagation)与经验回放失配(misaligned experience replay)。此外,我将介绍两种新近涌现的攻击范式:记忆窃取(memory extraction)与记忆注入(memory injection),揭示攻击者如何仅通过标准用户交互即可窃取或操纵智能体中存储的信息。这些攻击暴露了当前记忆架构中存在的根本性安全漏洞。

总体而言,在下一代大语言模型智能体的设计中,记忆既是一项强大的能力,也可能成为潜在的系统性风险,亟需重新审视与系统化建模。

论文:
How Memory Management Impacts LLM Agents: An Empirical Study of Experience-Following Behavior, 2025.
Unveiling Privacy Risks in LLM Agent Memory, ACL 2025.
Memory Injection Attacks on LLM Agents via Query-Only Interaction, NeurIPS 2025.

论文地址:
https://arxiv.org/abs/2505.16067
https://aclanthology.org/2025.acl-long.1227/
https://arxiv.org/abs/2503.03704v4

嘉宾

向臻,现任佐治亚大学(University of Georgia)计算学院助理教授,并同时隶属于人工智能研究所(Institute for Artificial Intelligence)以及网络安全与隐私研究所(Institute for Cybersecurity and Privacy)。他的研究方向包括可信机器学习、人工智能安全、大语言模型及智能体,以及统计信号处理。他担任多项重要机器学习会议的程序委员会委员,并任职于 IEEE TCSVT副编辑。
个人主页:
https://zhenxianglance.github.io/

入群

欢迎加入NICE每周分享交流群,可与NICEer唠嗑,以及第一时间收到后续NICE分享报告的通知。加群通过小助手认证,群内无广告。

备注【昵称-单位-方向-NICE入群】

NICE介绍

NICE(Nexus forIntelligenCE)是一个由全球50+位一线青年学者共同发起的顶尖AI前沿交流平台。 成立以来,我们汇聚海内外300+嘉宾,通过百余场线上深度分享与线下高规格活动(北京/上海/苏州等),全网积累超13万关注。目前,NICE已构建起覆盖中、美、欧的国际化团队,正加速在硅谷、纽约、香港等地落地,致力于打造连接学术、产业与未来的全球化AI前沿社区。
NICE主页
https://nice-nlp.github.io
NICE海外
https://nice-intl.github.io
b站
https://space.bilibili.com/507524288
Youtube
https://www.youtube.com/@NLPAcademicExchangePlatform

编辑:冯可蘅 华盛顿大学
http://www.jsqmd.com/news/156709/

相关文章:

  • PyTorch-CUDA-v2.6镜像结合Dify平台实现低代码AI应用开发
  • DAY52 CBAM注意力
  • PyTorch-CUDA-v2.6镜像助力自然语言处理任务提速
  • WinDbg蓝屏诊断技巧:内核内存布局图解说明
  • 企业级社区医疗服务可视化系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】
  • PyTorch-CUDA-v2.6镜像中安装PyTorch Geometric图神经网络库
  • 驱动如何读取设备树中的寄存器地址:操作指南
  • DUT硬件调试接口集成:JTAG与UART配置指南
  • ES6解构赋值详解:数组与对象的实用操作指南
  • PyTorch-CUDA-v2.6镜像在云服务器上的最佳实践配置
  • 计组速成5.指令系统
  • 区块链如何容忍拜占庭错误并规避其对系统的影响
  • 零基础学GPU的KMD专栏--第一部分:KMD开发基础​
  • 金仓数据库MongoDB兼容版深度评测:从性能到实战的全面解析
  • AI系统扩容方案设计:如何实现自动伸缩
  • 【开题答辩全过程】以 山林湖泊生态文明建设管控系统为例,包含答辩的问题和答案
  • Day38~atoi的实现
  • 数字化农家乐管理平台信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • PyTorch-CUDA-v2.6镜像端口映射设置指南(Jupyter/SSH)
  • 【2025最新】基于SpringBoot+Vue的水产养殖系统管理系统源码+MyBatis+MySQL
  • 【开题答辩全过程】以 基于微信小程序的疫情防控管理系统为例,包含答辩的问题和答案
  • 短链接生成-基于布隆过滤器和唯一索引
  • Java学习笔记:String、StringBuilder与StringBuffer
  • 项目1-通过RocketMQ 将短链接统计
  • HID协议实战案例:构建自定义人机接口设备
  • Wincc报表模板:功能与实现深度剖析
  • PyTorch-CUDA-v2.6镜像适配主流GPU,训练速度提升3倍以上
  • PyTorch-CUDA-v2.6镜像内置哪些工具?全面功能盘点
  • 新手必看:HAXM is not installed的驱动安装流程
  • AI编程工具-Trae: 上下文-索引-规则-引用