当前位置: 首页 > news >正文

基于情感增强机制的大语言模型虚假新闻检测

导读:

为解决现有新闻文本虚假检测方法仅依赖语义特征、忽视情感特征,导致复杂内容检测准确度低的问题,提出一种基于情感增强机制的大语言模型虚假新闻检测方法(Sentiment-Enhanced Large Language Model for Fake News Detection, SELLM-FND)。该方法先对新闻文本进行情感分析以提取情感特征,再通过大语言模型融合文本与情感特征完成检测。在WELFake_Dataset_Edited数据集上的实验显示,该方法准确率达0.929,检测性能优于以往基于文本的虚假新闻检测方法

作者:

冉广煜, 肖克晶:北京印刷学院信息工程学院,北京

论文详情

基于文本内容的虚假新闻检测的核心是准确地提取文本内容的特征,例如词汇频率、句法结构、事实引用数量等显性特征,以及语义一致性、上下文依赖、潜在立场等隐形特征。现有方法多聚焦于语义特征,却忽视了情感特征在虚假新闻检测中的重要作用。从心理学角度看,虚假新闻常通过激发受众强烈情绪影响其认知判断;从传播学角度,情感是虚假新闻快速传播的重要驱动力。基于此,本文提出基于情感增强机制的大语言模型虚假新闻检测方法,具体流程如下:在模型训练与微调阶段,先训练用于情感分析的子模型,再利用该部分模型为新闻数据集自动添加情感标注,然后利用该数据集通过低秩适配(Low-Rank Adaptation, LoRA)微调策略微调出可以通过文本语义和情感标签检测虚假新闻的核心部分。在部署阶段,该方法先对新闻的文本进行情感分析提取其中的情感特征,再对提取出来的情感特征和新闻文本进行整合与检测,实现更高精度的虚假新闻检测。

本文将假新闻检测任务定义为一个二分类任务,给定一个新闻的文本信息T,使其输出预测结果y,即需要设计函数f,使其满足y=f(T) 。为了实现情感增强,本文还需要对新闻文本T进行情感分析,其中情感分析过程定义为函数g2,情感分析的结果设为Emo,即有Emo=g2(T) 。同时将情感分析结果作为后续新闻检测的依据之一,即重新设计一个新的函数f2,可得:

模型如图1:

本文所提出的SELLM-FND模型,首先需要对新闻的文本进行情感分析提取其中的情感特征,情感分析部分使用BERT模型作为基础。

本文通过对预训练模型BERT进行微调,获得具备情感分析能力的BERTemotions模型。为使该模型区别于现有仅能进行极性判断的情感分析模型,本文使用情感数据集对其进一步训练,使其能够识别十一种情感,并输出由这些情感倾向组成的情感向量。为在充分体现文本情感倾向的同时减少模型计算量,我们进一步优化模型,使其仅输出情感倾向最强烈的三种情感所组成的情感向量。

为支撑本文研究,实验所需数据集需要满足“同时包含情感标签与新闻真实性标签”的高质量标注要求,然而,一方面,虚假新闻检测任务的数据集往往仅标注“真实/虚假”二元标签或简单的情感标签,缺乏细粒度情感标注(如愤怒、恐惧、喜悦);另一方面,情感分析专用数据集虽包含丰富的情感类别标注,却未关联新闻文本的真实性标签,无法直接满足“基于情感特征预测新闻真实性”的实验设计目标。

针对已有数据集不满足本文的研究目标的问题,本文采用在训练中途对数据集进行二次加工的方式,将训练任务一分为二,并将数据集预处理穿插在二者之间,具体流程分为三步:第一步,对预训练模型BERT进行微调,使其具备情感分析能力;第二步,基于微调后的模型为新闻数据集添加情感标注;第三步,利用完成情感标注的新数据集,对模型剩余部分展开训练。

本实验最终选用经新闻分类任务微调后的DeepSeek-R1模型(DeepSeek-R1-Distill-Qwen-7B-News-Classifier)作为基础模型(以下以基础模型代指)。

本实验使用sem_eval_2018数据集训练情感分析模型。

本文评估指标包括:准确率、精度、召回率以及F1指数。准确率是最直观的用于衡量预测假新闻和真实假新闻之间的相似性的指标,利用精度、召回率以及F1指数为假新闻检测提供整体预测性能,在假新闻检测中,这四个指标结合使用,能更全面地反映模型的实际效果。

对比结果如表2所示,仅基于细粒度情感分析的FOREAL模型与仅基于BERT微调的BERT_detection模型检测效果最差,推测原因是二者均依赖单一维度特征(FOREAL依赖情感特征,BERT_detection依赖语义特征),特征表征的全面性不足,导致检测性能受限。相比之下,融合情感维度与语义维度双特征的EmoSentBERT模型,检测效果显著优于上述两类单维度模型,验证了多维度特征融合对提升虚假新闻检测性能的有效性。

此外,未引入情感变量的两类大模型方法(LLM-GAN与DeepSeek-R1_detection),性能均优于传统预训练融合模型。其中,基于对抗提示机制的LLM-GAN模型,凭借大模型的逻辑推理与对抗训练优势,实现了0.916的准确率,但未融入情感特征,其性能仍落后于引入情感增强的模型;DeepSeek-R1_detection模型(基于基础模型DeepSeek-R1-Distill-Qwen-7B-News-Classifier针对虚假新闻检测任务进一步微调所得)虽未引入情感分析模块,但其检测效果仍优于FOREAL、BERT_detection与EmoSentBERT三类模型,这体现出了基础大模型在语义理解与任务适配方面的天然优势。

本文设计的SELLM-FND模型在DeepSeek-R1_detection的基础上增加了情感增强机制,其检测性能在所有评估指标中均表现最佳,各项指标均高于其他对比模型,且在精度与F1指数上的优势尤为突出。这表明,SELLM-FND模型在虚假新闻检测任务中具备更精准的预测能力与更均衡的综合性能,同时验证了情感增强机制对提升大模型虚假新闻检测效果的积极作用。

实验结果说明,单一的语义维度和情感维度的检测模型相比于能够结合两种维度的模型都相对落后,而单一的基于情感维度的模型检测也落后于基于语义的基础BERT模型检测,大模型的简单微调后的检测结果相比普通的预训练模型更好,基于情感增强机制的大语言模型虚假新闻检测方法,无论是比预训练模型还是未使用情感增强机制的大模型性能都更好。

为验证SELLM-FND模型各核心模块对虚假新闻检测性能的贡献度,明确不同模块的作用价值,本研究设计了2组消融实验。实验结果如表3所示。

综上,SELLM-FND模型的两大核心模块(情感模块、跨注意力融合)均对性能提升产生关键作用,其中情感模块的核心价值尤为突出,跨注意力融合保障了特征融合质量,二者与LoRA微调策略协同作用,共同实现了虚假新闻检测性能的最优表现。

需注意,单一语义维度或情感维度的检测模型性能均落后于双维度融合模型,而本文方法仍属于基于文本的单一模态检测方法,在面对包含文本、图像、音频和视频的多媒体新闻时的能力尚未得到验证。但即使能力可能有所不足,SELLM-FND模型作为基于文本的虚假新闻检测模型也可作为多模态虚假新闻检测中的文本模态处理方法,加入到多模态的虚假新闻检测中。

基金项目:

北京市教育委员会科研计划项目资助(KM202410015002);

北京印刷学院博士启动资金(27170123034、27170124026)。

原文链接:https://doi.org/10.12677/csa.2026.162044

http://www.jsqmd.com/news/349190/

相关文章:

  • 朝阳宠物寄养哪家比较专业正规?朝阳宠物寄服务好条件好的基地名单(2026年新版) - 品牌2025
  • Qwen2.5-VL-7B-Instruct入门指南:无需Python基础,浏览器操作完成全部视觉任务
  • Win11安装WSL2
  • 2026年湖南靠谱的防滑泳池漆盘点,倍克朗泳池专用漆口碑良好 - myqiye
  • 32、合并pdf
  • java+vue基于springboot高尔夫球场管理系统的设计与实现_xw0k572c
  • 为什么局域网ssh连接的@后面不能用localhost要用ip4呢192.168.1.11这种
  • 2.3 数据恢复神技:四种方案实现数据快速找回
  • 总结2026年哈尔滨好用的汽车音响升级公司,汽车音响改装升级服务推荐 - mypinpai
  • 什么牌子软骨素好 2026氨糖软骨素白皮书TOP10榜单出炉|关节养护怎么选?这10款实测有效 - 博客万
  • 话费充值卡可以变现吗?回收流程详解与注意事项一览 - 团团收购物卡回收
  • 2026年北京排名靠前的写字楼出租公司,盈都大厦等招租价格盘点 - 工业设备
  • 2026年艺术涂料厂家推荐及选购参考,艺术涂料招商/艺术涂料加盟/艺术涂料代理加盟/艺术涂料批发加盟/艺术涂料招商加盟 - 品牌策略师
  • 2026年深聊去屑洗发水,女士去屑洗发水牌子哪家好 - mypinpai
  • 2.4 水平扩展实战:支撑亿级数据的分库分表策略
  • 鞍山胜诉率高的律师有哪些,口碑情况如何 - 工业品网
  • 分析2026年常州聚氨酯异形垫块批量加工费用怎么算 - 工业品牌热点
  • 2026年通州宠物训练哪家好?通州专业正规的宠物训练基地精选 - 品牌2025
  • linux 内核核心初始化
  • 2026年湖南的金刚砂耐磨材料工厂排名,靠谱厂家全分享 - 工业推荐榜
  • 高光谱成像仪哪个品牌性价比高?2026热门品牌选型核心指南 - 品牌推荐大师1
  • 电子元器件回收服务费用多少,满芯微收费透明 - 工业品牌热点
  • 2026年热门的智慧水务,智慧园区,智慧能源公司专业评测推荐榜 - 品牌鉴赏师
  • 剖析凌创网络科技发展前景怎么样,为江西企业提供高性价比获客方案 - 工业设备
  • 毕设分享 yolov11医学影像脑瘤检测识别系统
  • 好写作AI:用AI秒速搭建论文大纲——把三个月的纠结压缩到三分钟
  • 直播录制神器,绝了
  • Dify 1.10.0-rc1 本地部署:无缝接入 Ollama 打造专属 AI 应用平台 - 实践
  • 干货合集:9个降AIGC平台测评,自考降AI率必备攻略
  • java+vue基于springboot宠物成长监管系统的设计与实现_hv51v658