当前位置: 首页 > news >正文

1. 假新闻检测 - 《Modality Perception Learning-Based Determinative Factor Discovery ...》

前言

本文阅读论文《Modality Perception Learning-Based Determinative Factor Discovery for MultimodalFake News Detection》。虚假新闻通常依赖夸张的语言风格、篡改的图像、不一致的多模态上下文等特征。虚假新闻检测应遵循“逻辑与”原则,即便大部分内容合理,只要存在少量不合理内容,即可判定为虚假。

核心内容细节
问题现有方法关注于多模态的一致性和设计复杂的特征提取器,而忽略了模态间的语义差异。例如下图中,文本与图像在表面上一致,但隐含夸张文本与篡改图像。
方法首先利用CLIP预训练编码器与模态特定编码器,分别提取模态一致与模态特定特征,然后进行多层次跨模态融合,最后根据模态异质性分数动态加权不同特征。
贡献设计双重编码模块,融合CLIP编码与模态特定编码;引入可学习的记忆信息,增强特征表示能力;构建多层次跨模态融合模块,深入理解模态间复杂关联;提出模态感知学习模块,根据模态分布差异自适应加权特征。


文章目录

  • 前言
  • 一、现有方法
  • 二、本文方法
  • 总结

一、现有方法

分类方法
单模态基于文本的检测:关注假新闻的语言特征,如夸张、煽动性。
基于视觉的检测:关注图像是否被篡改、是否具有误导性。
多模态多模态信息融合方法:分别提取文本和图像特征,再进行融合。
模态相似性度量方法:通过衡量文本与图像之间的语义一致性来辅助检测。
基于图神经网络与外部知识的方法:引入知识图谱或社交网络信息增强表示。

二、本文方法

  1. 对于某一特征,用 CNN 提取模态特定的特征,用 CLIP 提取一致特征,然后拼接。其中,文本编码器是 CNN + 池化,图像编码器是 ResNet-50;
  2. 引入可学习的记忆向量以提取不同模态特征真假模式,并进一步与提取的特征拼接;
  3. 使用多头自注意力增强每个模态自身的特征表示;
  4. 模仿人类先看图片辅助理解文字的习惯,以图像特征作为 Q,文本特征作为 K 和 V,通过跨模态注意力让图像信息增强文本信息f t v f_{tv}ftv。然后,模仿人类反复对照图文、捕捉深层线索的行为,进一步增强文本信息,同时使用视觉增强的文本特征作为 Q 增强原始图像特征;
  5. 用VAE将文本特征和图像特征分别映射到潜在空间,然后计算二者的 KL 散度,并用 sigmoid 将其映射到 0-1 区间。h hh越大,图文越不一致,将h hh作为多模态融合特征权重,1 − h 1-h1h作为单模态特征权重;
  6. 将加权后的四个特征拼接起来,并送入一个全连接层分类器进行真假二分类。

总结

文章的动机有点以结果为导向。

http://www.jsqmd.com/news/212485/

相关文章:

  • Java Web 网上购物商城系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】
  • vscode下载/常用插件分享及如何链接Ubuntu
  • idea不能使用低版本插件问题解决
  • MCU+AT到OpenCPU:嵌入式通信技术迭代的必然性(完结篇)
  • 基于Python+Django+SSM美妆产品网络评价数据采集与分析(源码+LW+调试文档+讲解等)/美妆产品评价分析/网络评价数据采集/美妆数据采集/美妆评价分析/美妆产品网络数据/美妆产品评价数据
  • MCU+AT架构的演进:向OpenCPU转型的必然性(完结篇)
  • 深度实战:AirCloud与excloud扩展库集成下的核心功能应用解析!
  • 快速上手iPerf:新手网络测试环境搭建详解!
  • 大规模语言模型在精准医疗方案生成中的应用
  • 【更新至2024年】1996-2024年各省公路里程数据
  • 【更新至2024年】1996-2024年各省铁路营业里程数据
  • 【项目中的经验总结】
  • Node.js用readableLength轻松控流
  • 从C到汇编:参数传递的内存地址探秘
  • [特殊字符]_Web框架性能终极对决:谁才是真正的速度王者[20260107173025]
  • 深入探讨Clang-Tidy与Bazel的整合
  • Python设计模式:享元模式详解
  • Agentic AI提示工程可解释性增强:重要方法与实际应用
  • [特殊字符]_安全性能平衡术:如何在保证安全的前提下提升性能[20260107173816]
  • 什么是M-LAG
  • 线性规划:库存切割问题
  • 数组寻址:深入理解指针与公式的差异
  • 智体觉醒:中国人形机器人理论重构与范式跃迁
  • 线性化注意力
  • 线性规划优化:基础
  • 数据标准管理实践指南(2.0)
  • 优化数据点值的自动化方案
  • Hive与Doris整合:MPP引擎加速大数据分析
  • LibGDX中的多边形绘制优化
  • 这是一份简洁的PHP开发速成手册