34、基于Doc2Vec和PCA的COVID - 19虚假新闻检测

基于Doc2Vec和PCA的COVID - 19虚假新闻检测

1. 引言

COVID - 19疫情期间,大量新闻涌现,同时虚假信息、猜测和假新闻也广泛传播。互联网在信息传播中起着重要作用,虚假新闻会影响人们对事实的认知,引发社会或经济问题,操纵公众舆论并改变政治结果。人们在疫情相关信息的传播中多次受到影响,因此检测虚假新闻内容至关重要。

手动检测虚假新闻是最准确的方法,但速度缓慢,无法对大量新闻进行标记。如今,随着科学计算和人工智能的普及,利用机器学习和特征工程可以开发出可扩展的自动检测虚假新闻的模型。不过,文本分类任务需要将文本文档转换为向量表示,并提取有区分性的特征。随着向量维度的增加,训练和推理时间会变长,不利于实时处理。

为此,提出了一种利用特征提取、归一化、降维和分类来识别与COVID - 19相关的虚假新闻的方法。该研究使用的是经过专家标注和验证的数据。

2. 过往研究

COVID - 19疫情为多个领域的研究带来了机会,数字信息相关科学也不例外。许多研究使用机器学习方法来检测与这一全球性问题相关的虚假新闻。
- 传统特征工程和机器学习模型
- Felber利用n - 元语法、情感基调、标点等语言特征,以及支持向量机(SVM)、线性回归(LR)、随机森林(RF)、朴素贝叶斯(NB)和多层感知器等机器学习模型对虚假和真实评论进行分类,在包含10700条与COVID - 19相关新闻的数据集上,准确率达到90.79% - 95.70%。
- Shushkevich和Cardiff提出使用由双向长短期记忆、支持向量机、逻辑回归、朴素贝叶斯以及逻辑回归和朴素贝叶

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值