基于预训练Transformer模型的自动假新闻检测
1. 二元分类研究概述
在假新闻检测的二元分类领域,不同研究团队采用了各种方法和模型进行实验。以下是一些相关研究及其成果:
- Mao和Liu :在2019年FACT挑战中,使用西班牙语数据进行事实与反事实的二元分类。不过,他们的模型出现过拟合问题,最终准确率仅为0.622。
- Levi等人 :以BERT为模型,研究了假新闻和讽刺新闻的标题与正文之间的差异。
- Rodriguez和Iglesias :将BERT与另外两个神经网络用于假新闻的二元分类,使用了Getting Real About Fake News数据集,并添加了真实新闻文章。
- Aggarwal等人 :使用NewsFN数据集,对XGboost、CNN和BERT进行测试。该数据集在假新闻和真实新闻文章的分布上非常均衡,BERT - base - uncased版本取得了97.021%的准确率。
- Liu等人 :使用BERT对短语句进行多分类,结合额外元数据时准确率为41.58%,仅使用语句时准确率为34.51%。
- Antoun等人 :使用XLNet、RoBERTa和BERT对QICC竞赛数据集进行假新闻二元分类,最佳模型XLNet的F1分数达到98%的准确率。在新闻领域检测任务中,将新闻分为政治、商业、体育、娱乐、科技和教育六个类别,RoBERTa准确率为94%,基于ELMo词嵌入的带注意力机制的Bi - L
超级会员免费看
订阅专栏 解锁全文
898

被折叠的 条评论
为什么被折叠?



