当前位置: 首页 > news >正文

2025_NIPS_GUARDIAN: Safeguarding LLM Multi-Agent Collaborations with Temporal Graph Modeling

文章核心总结与创新点

主要内容

本文针对大语言模型(LLM)多智能体协作中存在的幻觉放大、错误注入与传播等安全问题,提出了名为GUARDIAN的统一防护框架。该框架将多智能体协作过程建模为离散时间时序属性图,通过无监督编码器-解码器架构、信息瓶颈理论驱动的图抽象机制和增量训练范式,实现对异常节点(智能体)和边(通信)的精准检测与剔除,在不修改底层LLM的前提下,保障协作系统的安全性和可靠性。实验验证了该框架在MMLU、MATH、FEVER等多个基准数据集上的优异性能,在各类安全场景下均达到当前最优准确率,且资源消耗高效。

创新点

  1. 时序属性图建模:首次将多智能体协作过程抽象为时序属性图,节点表示不同时间步的智能体,边表示智能体间通信,节点属性编码智能体响应,直观捕捉幻觉和错误的传播动态。
  2. 双解码器无监督架构:设计属性重构解码器和结构重构解码器,分别从节点语义属性和网络拓扑结构两个维度检测异常,减少单一模态干扰,提升检测精度。
  3. 信息瓶颈图抽象:首次将信息瓶颈理论应用于LLM多智能体安全防护,在压缩时序交互图冗余信息的同时保留关键模式,平衡信息压缩与任务相关性。
  4. 增量训练范式:贴合多智能体协作的时序特性,通过逐轮微调模型并剔除已检测异常,使模型动态适应协作模式变化,无需划分训练/测试集。
  5. 模型无关兼容性:无需修改底层LLM结构,可适配闭源和开源模型,兼
http://www.jsqmd.com/news/698001/

相关文章:

  • 收藏!2026 年版大模型核心精讲:Tools、Agent、Workflow 三者区别与落地层级详解
  • MarkDownload:从网页到笔记,三步打造你的知识库
  • ANOVA与Kruskal-Wallis检验在房地产数据分析中的应用
  • 探索1Fichier下载管理器:突破文件下载限制的智能解决方案
  • 在电脑上畅玩Switch游戏:Ryujinx模拟器终极使用指南
  • 如何用LizzieYzy在5分钟内搭建专业级围棋AI分析系统
  • 2026年知网检测AI率太高会被延毕吗?高效掌握高校AIGC审核标准与对策 - 降AI实验室
  • Linux kernel debug trace: ftrace
  • 5分钟快速上手KrkrzExtract:新一代krkrz游戏资源处理工具终极指南
  • 抖音无水印下载器终极指南:免费批量保存视频的完整教程
  • 2025届最火的AI论文平台解析与推荐
  • 计算机毕业设计Python+PyTorch恶意流量检测系统 信息安全 网络安全(源码+LW+PPT+讲解)
  • UltraScale+ 40G/50G以太网子系统IP核的GT时钟共享优化实践
  • ClickShow:为Windows鼠标操作增添可视化反馈的实用工具
  • 国内专业汽车零配件产品包装设计行业TOP5设计公司市场调研测评报告(2026版) - 设计调研者
  • 网络取证分析第一步:用Python+libpcap快速批量处理海量pcapng抓包文件
  • 3个步骤掌握curatedMetagenomicData:解锁人类微生物组研究的标准化数据宝库
  • 保姆级教程:用Realsense D435i和VINS-Fusion给PX4飞控做视觉定位,坐标转换避坑指南
  • Showdown.js 深度实战指南:JavaScript Markdown转换库的完整使用技巧
  • 3分钟搞定GitHub界面汉化:终极中文插件使用指南
  • 如何快速掌握SJTUThesis:面向新手的上海交通大学LaTeX论文模板完整指南
  • Qwen3-4B-Instruct效果展示:支持思维链(CoT)的超长数学证明生成
  • 基于 Qt C++ 开发对接 航天科工量子导航设备 的应用
  • 别再死记硬背了!用这个免费在线工具,5分钟看懂史密斯圆图怎么匹配天线阻抗
  • 3个核心技巧彻底解决Blender到Unity坐标混乱:为什么你的模型总是导入失败?
  • 光学工程专业英语核心词汇精讲:从基础概念到像差解析
  • 别再为m3u8播放发愁了!一个Express服务搞定咪咕视频的播放地址加密问题
  • 别再死记硬背了!用Python脚本模拟UDS诊断请求,手把手教你玩转ISO 14229-1
  • 构建一个完善的数据库运维体系
  • PDF-Parser-1.0功能实测:上传PDF自动分析,结果清晰易懂