虚假新闻的分析与机器学习检测研究
一、虚假新闻的分析
1.1 基于词云的分析
词云可视化展示了在抓取推文的整个时间段内,推文中最常使用的词汇。从词云图中可以看出,在虚假新闻的情况下,“美国”“印度”“武汉”“冠状病毒”“中国”和“可能”等词汇最为常见。这表明在虚假新闻传播中,这些词汇被频繁提及,可能是虚假新闻制造者用来吸引眼球或引导舆论的手段。
1.2 按日期和数量的分析
按日期统计特定日期(前 50 个日期)的推文数量,且这些推文的关键词通常与 COVID - 19 相关。从图中明显可以看出,大部分推文集中在 2020 年 3 月 31 日,其次是 2020 年 3 月 19 日等。当时,疫情在发达国家正处于发展阶段,许多国家面临封锁紧急情况,这进一步加剧了虚假新闻和谣言在人群中的传播。
|日期|推文数量情况|
| ---- | ---- |
|2020 年 3 月 31 日|大部分推文集中在此日期|
|2020 年 3 月 19 日|推文数量较多,仅次于 3 月 31 日|
1.3 传播范围的分析
传播范围指的是推文或新闻的传播程度,分析的参数是转发和点赞数。还对转发和点赞数的组合进行了分析,以了解某些组合是否能提供与两个参数单独分析时相似的结果。通过图表展示了在疫情期间,拥有最高转发数、点赞数以及推文 + 点赞数的顶级用户。这有助于了解哪些用户在虚假新闻传播中起到了较大的推动作用。
1.4 个人传播情况
研究发现,大部分虚假新闻传播发生在 3 月份,即使是没有事实依据的新闻也有很广的传播范围。不仅小镇居民或普通个人参与了
超级会员免费看
订阅专栏 解锁全文
660

被折叠的 条评论
为什么被折叠?



