假新闻与社交媒体用户特征分析:洞察公众认知与行为
在当今数字化时代,假新闻和社交媒体用户特征分析成为了备受关注的话题。假新闻的传播不仅影响公众的认知和决策,还对社会稳定和民主进程构成威胁。同时,社交媒体作为信息传播的重要平台,蕴含着丰富的用户行为和特征信息。下面我们将深入探讨假新闻相关研究以及如何从社交媒体中提取用户特征。
假新闻研究:词汇、话题与情感分析
共现网络分析
研究假新闻相关词汇的一种方法是观察共现网络。通过比较2016年美国大选前后的共现网络,我们可以直观地分析与“假新闻”共现的词汇变化。构建共现词图的步骤如下:
1. 统计两个给定单词共现的上下文数量,得到每对单词的共现次数。
2. 对这些值进行归一化处理,使用百分比而非绝对共现次数。
3. 过滤掉次要关系,突出最强关系。当共现百分比低于0.8%(大选前)和0.5%(大选后)时,移除节点和边,并根据两个单词之间关联的强度绘制边的宽度。
4. 获取两个图的最大生成树。
从共现网络的变化中可以看出,大选前与“假新闻”共现的词汇主要与新闻行业本身(如“文章”“故事”“骗局”)和互联网(如“网站”“推特”“脸书”“账户”)相关,还有与讽刺电视节目和主持人相关的词汇。而大选后,出现了与特定事件(主要是美国大选)相关的词汇,以及围绕假新闻的元讨论相关概念,如“事实核查”“仇恨言论”“后真相”和“替代事实”。
主题分析
为了找出围绕“假新闻”出现的文本中涉及的主要主题,我们使用了潜在狄利克雷分配(LDA)方法。具体步骤如下:
1. 将数据集中的所有单词小写并进行分词。
2. 使用自然语言工具包提供的停用词
超级会员免费看
订阅专栏 解锁全文
4796

被折叠的 条评论
为什么被折叠?



