量化推特上的媒体影响力和党派关注度
在英国脱欧公投期间,推特成为了人们交流和分享信息的重要平台。本文将探讨推特上脱欧相关讨论中的信息来源、不同立场支持者的媒体分享模式,以及党派和误导性材料的影响。
数据收集与处理
- 推文收集 :截至2016年6月23日(欧盟公投日),共收集了约1750万条推文。重点关注公投前一个月的数据,此期间有超过1320万条推文,来自180多万不同用户。推文基于一系列关键词和主题标签收集,涵盖留欧和脱欧相关内容。
- URL扩展 :推文中的大多数URL被缩短,为了获取原始链接,手动分析积累了18个URL缩短或重定向服务列表。遇到缩短的URL时,通过HTTP重定向或短链接服务的API进行递归扩展,直到得到原始URL。
用户投票意向分类
- 分类方法 :根据用户推文中使用的表明支持留欧或脱欧的主题标签来分类用户投票意向。仅使用推文最后位置的主题标签,因为它们更能准确反映用户立场。
- 评估方法 :使用明确声明投票意向的用户数据进行评估。一家名为Brndstr的公司开展活动,根据用户的投票意向声明提供主题头像修改服务,以此获取真实样本数据。结果显示,基于单条党派推文分类的准确率达94%,若要求三条党派推文,准确率可达99%。
| 条件 | 总数 | Brndstr找到的数量 |
|---|
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



