当前位置：首页 > news >正文

基于情感增强机制的大语言模型虚假新闻检测

news 2026/3/27 5:15:28

导读：

为解决现有新闻文本虚假检测方法仅依赖语义特征、忽视情感特征，导致复杂内容检测准确度低的问题，提出一种基于情感增强机制的大语言模型虚假新闻检测方法(Sentiment-Enhanced Large Language Model for Fake News Detection, SELLM-FND)。该方法先对新闻文本进行情感分析以提取情感特征，再通过大语言模型融合文本与情感特征完成检测。在WELFake_Dataset_Edited数据集上的实验显示，该方法准确率达0.929，检测性能优于以往基于文本的虚假新闻检测方法

作者:

冉广煜, 肖克晶：北京印刷学院信息工程学院，北京

论文详情

基于文本内容的虚假新闻检测的核心是准确地提取文本内容的特征，例如词汇频率、句法结构、事实引用数量等显性特征，以及语义一致性、上下文依赖、潜在立场等隐形特征。现有方法多聚焦于语义特征，却忽视了情感特征在虚假新闻检测中的重要作用。从心理学角度看，虚假新闻常通过激发受众强烈情绪影响其认知判断；从传播学角度，情感是虚假新闻快速传播的重要驱动力。基于此，本文提出基于情感增强机制的大语言模型虚假新闻检测方法，具体流程如下：在模型训练与微调阶段，先训练用于情感分析的子模型，再利用该部分模型为新闻数据集自动添加情感标注，然后利用该数据集通过低秩适配(Low-Rank Adaptation, LoRA)微调策略微调出可以通过文本语义和情感标签检测虚假新闻的核心部分。在部署阶段，该方法先对新闻的文本进行情感分析提取其中的情感特征，再对提取出来的情感特征和新闻文本进行整合与检测，实现更高精度的虚假新闻检测。

本文将假新闻检测任务定义为一个二分类任务，给定一个新闻的文本信息T，使其输出预测结果y，即需要设计函数f，使其满足y=f(T) 。为了实现情感增强，本文还需要对新闻文本T进行情感分析，其中情感分析过程定义为函数g2，情感分析的结果设为Emo，即有Emo=g2(T) 。同时将情感分析结果作为后续新闻检测的依据之一，即重新设计一个新的函数f2，可得：

模型如图1：

本文所提出的SELLM-FND模型，首先需要对新闻的文本进行情感分析提取其中的情感特征，情感分析部分使用BERT模型作为基础。

本文通过对预训练模型BERT进行微调，获得具备情感分析能力的BERTemotions模型。为使该模型区别于现有仅能进行极性判断的情感分析模型，本文使用情感数据集对其进一步训练，使其能够识别十一种情感，并输出由这些情感倾向组成的情感向量。为在充分体现文本情感倾向的同时减少模型计算量，我们进一步优化模型，使其仅输出情感倾向最强烈的三种情感所组成的情感向量。

为支撑本文研究，实验所需数据集需要满足“同时包含情感标签与新闻真实性标签”的高质量标注要求，然而，一方面，虚假新闻检测任务的数据集往往仅标注“真实/虚假”二元标签或简单的情感标签，缺乏细粒度情感标注(如愤怒、恐惧、喜悦)；另一方面，情感分析专用数据集虽包含丰富的情感类别标注，却未关联新闻文本的真实性标签，无法直接满足“基于情感特征预测新闻真实性”的实验设计目标。

针对已有数据集不满足本文的研究目标的问题，本文采用在训练中途对数据集进行二次加工的方式，将训练任务一分为二，并将数据集预处理穿插在二者之间，具体流程分为三步：第一步，对预训练模型BERT进行微调，使其具备情感分析能力；第二步，基于微调后的模型为新闻数据集添加情感标注；第三步，利用完成情感标注的新数据集，对模型剩余部分展开训练。

本实验最终选用经新闻分类任务微调后的DeepSeek-R1模型(DeepSeek-R1-Distill-Qwen-7B-News-Classifier)作为基础模型(以下以基础模型代指)。

本实验使用sem_eval_2018数据集训练情感分析模型。

本文评估指标包括：准确率、精度、召回率以及F1指数。准确率是最直观的用于衡量预测假新闻和真实假新闻之间的相似性的指标，利用精度、召回率以及F1指数为假新闻检测提供整体预测性能，在假新闻检测中，这四个指标结合使用，能更全面地反映模型的实际效果。

对比结果如表2所示，仅基于细粒度情感分析的FOREAL模型与仅基于BERT微调的BERT_detection模型检测效果最差，推测原因是二者均依赖单一维度特征(FOREAL依赖情感特征，BERT_detection依赖语义特征)，特征表征的全面性不足，导致检测性能受限。相比之下，融合情感维度与语义维度双特征的EmoSentBERT模型，检测效果显著优于上述两类单维度模型，验证了多维度特征融合对提升虚假新闻检测性能的有效性。

此外，未引入情感变量的两类大模型方法(LLM-GAN与DeepSeek-R1_detection)，性能均优于传统预训练融合模型。其中，基于对抗提示机制的LLM-GAN模型，凭借大模型的逻辑推理与对抗训练优势，实现了0.916的准确率，但未融入情感特征，其性能仍落后于引入情感增强的模型；DeepSeek-R1_detection模型(基于基础模型DeepSeek-R1-Distill-Qwen-7B-News-Classifier针对虚假新闻检测任务进一步微调所得)虽未引入情感分析模块，但其检测效果仍优于FOREAL、BERT_detection与EmoSentBERT三类模型，这体现出了基础大模型在语义理解与任务适配方面的天然优势。

本文设计的SELLM-FND模型在DeepSeek-R1_detection的基础上增加了情感增强机制，其检测性能在所有评估指标中均表现最佳，各项指标均高于其他对比模型，且在精度与F1指数上的优势尤为突出。这表明，SELLM-FND模型在虚假新闻检测任务中具备更精准的预测能力与更均衡的综合性能，同时验证了情感增强机制对提升大模型虚假新闻检测效果的积极作用。

实验结果说明，单一的语义维度和情感维度的检测模型相比于能够结合两种维度的模型都相对落后，而单一的基于情感维度的模型检测也落后于基于语义的基础BERT模型检测，大模型的简单微调后的检测结果相比普通的预训练模型更好，基于情感增强机制的大语言模型虚假新闻检测方法，无论是比预训练模型还是未使用情感增强机制的大模型性能都更好。

为验证SELLM-FND模型各核心模块对虚假新闻检测性能的贡献度，明确不同模块的作用价值，本研究设计了2组消融实验。实验结果如表3所示。

综上，SELLM-FND模型的两大核心模块(情感模块、跨注意力融合)均对性能提升产生关键作用，其中情感模块的核心价值尤为突出，跨注意力融合保障了特征融合质量，二者与LoRA微调策略协同作用，共同实现了虚假新闻检测性能的最优表现。

需注意，单一语义维度或情感维度的检测模型性能均落后于双维度融合模型，而本文方法仍属于基于文本的单一模态检测方法，在面对包含文本、图像、音频和视频的多媒体新闻时的能力尚未得到验证。但即使能力可能有所不足，SELLM-FND模型作为基于文本的虚假新闻检测模型也可作为多模态虚假新闻检测中的文本模态处理方法，加入到多模态的虚假新闻检测中。