当前位置: 首页 > news >正文

PrismAgent:基于零样本可解释多智能体框架的模因危害性挖掘

一、基础信息

  1. 标题
  • 英文:PrismAgent: Illuminating Harm in Memes via a Zero-Shot Interpretable Multi-Agent Framework
  • 中文:PrismAgent:基于零样本可解释多智能体框架的模因危害性挖掘
  1. 作者
  • Zihan Ding¹、Ziyuan Yang²、Yi Zhang¹(* 通讯作者)
  • 单位:¹ 四川大学 ² 新加坡南洋理工大学
  1. 来源:arXiv 预印本(cs.LG 机器学习方向)
  1. 发布时间:2026 年 5 月 1 日(arXiv:2605.02940v1)

二、研究背景与问题

(一)研究动机(现有方法不足)

  1. 数据依赖严重:传统有害模因检测依赖大规模标注数据,训练成本高,易过拟合训练分布,泛化性差,无法适配快速演变的模因内容。
  1. 语义理解困难:模因语义隐含,依赖文化常识、视觉符号、多模态反讽,单步预测模型难以捕捉潜在真实意图。
  1. 可解释性缺失:现有多智能体框架在零样本场景下,无法充分解决模因隐喻的可解释推理问题。

(二)研究问题

零样本、无标注数据依赖的前提下,实现高检测精度、高可解释性有害模因检测,同时适配模因的动态演变特性

三、Methods 小节详细笔记

3.1 Overview(框架概述)

image
  1. 核心定位:零样本、多智能体、可解释的有害模因检测框架,模拟刑事侦查全流程
  1. 智能体分工分析师→调查员→检察官→法官,四智能体协作完成检测。
  1. 核心优势:无需训练、无标注数据依赖;显式多阶段推理链,决策全程可解释。
  1. 流程逻辑:意图挖掘→证据检索→初步判决→最终仲裁。

3.2 Analyst Agent(分析师智能体)

  1. 核心目标:放大模因隐含意图,从善意 / 恶意两种对立传播意图出发改写模因。
  1. 执行步骤
  • 输入原始模因
    (V = 视觉,T = 文本)。
  • 按善意提示 Pb生成善意改写版 Mb,按恶意提示Pm生成恶意改写版 Mm
    输出集合:
 
  1. 公式
$M_{b}= Agent _{Ana }\left(M_{ori }, P_{b}\right)$
$M_{m}= Agent _{Ana }\left(M_{ori }, P_{m}\right)$

3.3 Investigator Agent(调查员智能体)

  1. 核心目标:从未标注参考数据集检索证据,构建模因上下文解释。
  1. 执行步骤
  • 证据检索:用匹配函数 ​f()从$D_{ref}$检索 top-3 相似模因作为证据$Q_{evi}$
  • 逐步解读:按相似度降序整合证据,生成上下文解释 $O_i$
  • 动态适配:部署阶段可实时扩展数据集,适配新模因趋势。
  1. 公式
image

3.4 Prosecutor Agent(检察官智能体)

  1. 核心目标:分视角做危害性初步判断,校验结论一致性。
  1. 执行步骤
  • 分别将原始 / 善意 / 恶意版本与对应上下文解释结合,生成 3 次独立判决
  • 一致性判断:3 次结论一致则直接定案;不一致则移交法官仲裁。
 
  1. 公式

image

3.5 Judge Agent(法官智能体)

  1. 核心目标:整合所有证据与矛盾点,输出可解释的最终判决。
  1. 执行步骤
  • 核心表征生成:复用证据$Q_{evi}$
    总结相似模因的共性主题、表达手法。
  • 矛盾仲裁:聚焦争议核心,结合原始模因、证据、核心表征做最终判决。
  1. 公式
image

四、Experiment

(一)实验数据集

采用 3 个公开有害模因数据集,训练集仅用于检索,不参与训练,严格保持零样本设定:
  1. HarM:新冠相关模因,合并 “极有害 / 部分有害” 为有害类。
  1. FHM:Facebook 仇恨模因挑战数据集。
  1. MAMI:针对女性的贬损性模因数据集。

(二)Baselines(对比方法)

  1. 监督训练方法:Late Fusion、MOMENTA。
  1. 零样本方法
  • 闭源 VLM:GPT-4o、Gemini-2.0-Flash。
  • 开源 VLM:LLaVA 系列、InstructBLIP、MiniGPT-v2、OpenFlamingo。
  1. 智能体方法:MIND(当前最优零样本有害模因检测框架)。

(三)实验内容、结果与结论

1. 有害模因检测主实验

image

  • 内容:在 3 个数据集上对比所有基线的准确率、宏 F1
  • 结果
  • PrismAgent 全面优于现有零样本方法,比 MIND 平均精度 + 2.23%、宏 F1+2.78%。
  • 13B 参数 backbone 性能媲美 34B 大模型,效率与推理能力突出。
  • 结论:框架检测性能显著优于现有方法。
2. 泛化性实验
image
  • 内容:适配开源 / 闭源不同 VLM backbone,验证框架通用性。
  • 结果:在所有模型上均提升性能,LLaVA-1.6-34B 上平均精度 + 2.79%、宏 F1+4.43%。
  • 结论:框架适配性强,可无缝集成不同视觉语言模型。
3. 消融实验
  • 内容:移除任一智能体(分析师 / 调查员 / 检察官 / 法官),测试性能变化。
  • image
  • 结果:移除任意组件性能均显著下降。
  • 结论:四智能体协同是框架性能的核心保障。
4. 分析师智能体实验
image
  • 内容:验证双意图改写 + 多版本输入的有效性。
  • 结果:多版本输入显著提升性能,缓解数据集类别不平衡问题。
  • 结论:对立意图改写有效放大模因潜在语义。
5. 检察官智能体实验
image
  • 内容:测试检索证据数量 k 对性能的影响。
  • 结果:k=7 时性能最优,平衡证据覆盖度与相关性。
  • 结论:合理的证据数量可避免噪声干扰。
(四)实验总结论
PrismAgent 在零样本设定下,实现更优的有害模因检测精度,同时具备高可解释性、强泛化性、强鲁棒性,可适配模因的动态演变。
五、论文核心观点与贡献
  1. 框架创新:提出首个模拟刑事侦查流程的零样本多智能体可解释框架,将检测拆解为结构化子任务。
  1. 推理创新:设计显式多阶段推理链,全程可解释,解决模因隐含语义理解难题。
  1. 效果验证:在 3 个公开数据集上超越现有 SOTA 零样本方法,泛化性与鲁棒性突出。
  1. 应用价值:无需标注数据、无需训练,可实时部署适配社交媒体模因治理。
 
http://www.jsqmd.com/news/835346/

相关文章:

  • 上海信誉良好的髋关节置换医院选择指南:资深视角解析 - 奔跑123
  • 【西门子-tcp服务端】
  • 2026年AIGC检测通关指南:12款降ai率工具深度测评(含免费降ai率方案) - 降AI实验室
  • 写日志!运营程序
  • TRUST Agents
  • 厦门 App 开发优选解析 行业发展现状全面解读 - 软件测评师
  • 北京钢筋混凝土化粪池厂家实力排行及核心维度对比 - 奔跑123
  • 父组件逻辑 (App)
  • 湖南靠谱耐用水处理厂家分析 东隆环保稳居行业优选前列,生活污水处理/锅炉水处理/废水回用水处理,水处理设备哪家有实力 - 品牌推荐师
  • 北京水泥预制检查井厂家排行:合规与实用维度实测 - 奔跑123
  • 讨厌这个地方
  • 2026北京热门办公楼出租推荐榜:北京写字楼招租/北京商务楼 - 元点智创
  • 2026年告别AI检测重复警报:快速降AI工具推荐 - 降AI实验室
  • 歌声转换SVC主流方法原理剖析5 — LATHER-SVC
  • 北京水泥蓄水池厂家排行:核心实力与落地案例对比 - 奔跑123
  • 刚刚发布!无锡黄金回收实测:5家正规店排名 - 天天生活分享日志
  • 2026年呼和浩特市仓库货架厂家权威推荐榜/组合式货架,模块化货架,拆装式货架 - 品牌推广大师
  • API 网关鉴权超时导致请求失败 error code 504 怎么优化?
  • 北京地区水泥预制隔油池供应商综合排行实测分析 - 奔跑123
  • 武汉:报考中质协六西格玛黑带和绿带指定报考机构推荐 - 众智商学院课程中心
  • 2026年北京办公室出租优质服务公司最新推荐榜:助力企业精准选址 - 元点智创
  • 5.11 axios的使用
  • 2026省电空气能取暖机靠谱品牌盘点!6大主流头部品牌权威解读,避坑选购一次说清 - 匠言榜单
  • 40.嘉兴报考CPPM与SCMP,职场进阶优选众智商学院 - 众智商学院课程中心
  • 无锡黄金回收避坑!实测4家机构,正规渠道这样选更划算 - 天天生活分享日志
  • 南充市场门头招牌|2026年5月(上、中、下旬)工厂定制及政策|华蔓广告设计制作指导价 - 四川华蔓广告有限公司
  • 2026北京优质写字楼租赁服务商推荐 - 元点智创
  • 西安新希望职业高中官方电话 - 博客湾
  • 第四章指令系统
  • 苏州:报考中质协六西格玛黑带和绿带指定报考机构推荐 - 众智商学院课程中心