社交媒体虚假新闻分类:基于情感分析的探索
1. 引言
互联网让信息得以实时传遍全球,给社会带来诸多益处,但也存在弊端,信息可能不准确、具误导性甚至是故意造假。虚假新闻已成为常见话题。在社交媒体领域,它既是便捷的信息来源,也是虚假新闻传播的温床,虚假新闻的快速传播会对个人、社会乃至国家造成巨大危害。
公众情绪对社会的影响日益增大,准确实时地衡量公众情绪变得十分必要,而情感分析是实现这一目标的有效途径。本研究聚焦于利用情感分析区分社交媒体上的真假新闻,以应对虚假新闻传播的挑战。
Twitter作为主流社交网络,是新闻传播的重要平台。我们使用了两个Twitter新闻数据集:FakeNewsNet和CredBank,分别反映虚假和真实新闻,总数据量超过250万条推文。为了对这些推文进行情感分类,我们采用传统自然语言处理(NLP)技术处理语料,并运用机器学习方法,如朴素贝叶斯和决策树进行情感分析和真假新闻的自动判别。同时,为处理大数据问题,还使用了双向长短时记忆网络(Bi - LSTM)训练分类器。
2. 相关工作
社交媒体作为信息传播的重要媒介,其信息质量受到众多研究者的关注,情感分析也得到了广泛探索,包括非英语情感分析以及结合地理位置、时间因素的情感分析。
在短消息(推文)的真假新闻研究方面,Buntain和Golbeck开发了CredBank数据集,Shu等人提供了FakeNewsNet数据集。对于情感分析,许多工作集中在文本预处理、特征提取和模型训练上。例如,一些研究使用传统自然语言处理方法建立情感分类框架,利用机器学习模型训练分类器,并采用N - Gram方法进行特征提取。还有研究使用Levensthein距离对单词
社交媒体虚假新闻分类研究
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



