67、基于预训练Transformer模型的自动假新闻检测

QuietPulse

于 2025-07-18 10:44:39 发布

阅读量52

点赞数

CC 4.0 BY-SA版权

分类专栏：解析模式识别与深度学习的前沿进展文章标签：假新闻检测 Transformer BERT

本文链接：https://blog.youkuaiyun.com/c2d3e4f/article/details/149544357

解析模式识别与深度学习的前沿进展专栏收录该内容

71 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基于预训练Transformer模型的自动假新闻检测

1. 二元分类研究概述

在假新闻检测的二元分类领域，不同研究团队采用了各种方法和模型进行实验。以下是一些相关研究及其成果：
- Mao和Liu ：在2019年FACT挑战中，使用西班牙语数据进行事实与反事实的二元分类。不过，他们的模型出现过拟合问题，最终准确率仅为0.622。
- Levi等人 ：以BERT为模型，研究了假新闻和讽刺新闻的标题与正文之间的差异。
- Rodriguez和Iglesias ：将BERT与另外两个神经网络用于假新闻的二元分类，使用了Getting Real About Fake News数据集，并添加了真实新闻文章。
- Aggarwal等人 ：使用NewsFN数据集，对XGboost、CNN和BERT进行测试。该数据集在假新闻和真实新闻文章的分布上非常均衡，BERT - base - uncased版本取得了97.021%的准确率。
- Liu等人 ：使用BERT对短语句进行多分类，结合额外元数据时准确率为41.58%，仅使用语句时准确率为34.51%。
- Antoun等人 ：使用XLNet、RoBERTa和BERT对QICC竞赛数据集进行假新闻二元分类，最佳模型XLNet的F1分数达到98%的准确率。在新闻领域检测任务中，将新闻分为政治、商业、体育、娱乐、科技和教育六个类别，RoBERTa准确率为94%，基于ELMo词嵌入的带注意力机制的Bi - L