67、基于预训练Transformer模型的自动假新闻检测

基于预训练Transformer模型的自动假新闻检测

1. 二元分类研究概述

在假新闻检测的二元分类领域,不同研究团队采用了各种方法和模型进行实验。以下是一些相关研究及其成果:
- Mao和Liu :在2019年FACT挑战中,使用西班牙语数据进行事实与反事实的二元分类。不过,他们的模型出现过拟合问题,最终准确率仅为0.622。
- Levi等人 :以BERT为模型,研究了假新闻和讽刺新闻的标题与正文之间的差异。
- Rodriguez和Iglesias :将BERT与另外两个神经网络用于假新闻的二元分类,使用了Getting Real About Fake News数据集,并添加了真实新闻文章。
- Aggarwal等人 :使用NewsFN数据集,对XGboost、CNN和BERT进行测试。该数据集在假新闻和真实新闻文章的分布上非常均衡,BERT - base - uncased版本取得了97.021%的准确率。
- Liu等人 :使用BERT对短语句进行多分类,结合额外元数据时准确率为41.58%,仅使用语句时准确率为34.51%。
- Antoun等人 :使用XLNet、RoBERTa和BERT对QICC竞赛数据集进行假新闻二元分类,最佳模型XLNet的F1分数达到98%的准确率。在新闻领域检测任务中,将新闻分为政治、商业、体育、娱乐、科技和教育六个类别,RoBERTa准确率为94%,基于ELMo词嵌入的带注意力机制的Bi - L

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值