政治偏见和可靠性对用户参与度的时间效应分析
1. 时间划分与数据处理
为了研究帖子的时间动态,我们将21天的时间段划分为更小的时间桶。具体操作如下:
- 选择四个时间桶,并确定时间阈值,使得每个桶中的总交互数量大致相同。这些阈值代表了CrowdTangle观察到总体交互(所有交互类型之和)的25%、50%和75%的时间点,若阈值落在样本点之间则采用线性插值法。
- 这种划分方式不依赖于实际概率分布的假设,有助于在四个不同阶段对用户交互差异进行公平的对比,从而最大化信息增益。
2. 捕捉参与度动态
- 定义指标 :定义总交互覆盖比率(TICR),即帖子在特定时间段内获得的总交互占其总交互的百分比。例如,若一个帖子在整个时间线上最多获得600次交互,在发布后的1 - 5小时内获得200次交互,则该时间段的TICR为33%。
- 数据处理 :计算每个帖子在所有探测时间的TICR值,然后计算每个时间桶内成功探测的平均值。去除在四个时间桶中未至少被探测一次或总交互少于10次(包括0次交互)的帖子,以减少非热门帖子的噪音,提高结果的稳定性。最后,去除没有剩余帖子的文章。
3. 数据集概述
最终数据集的摘要统计信息如下表所示:
| Articles# | Domains# | Posts# | Total interactions# | Bias mean | Reliability mean |
| — | — | — | — | — | — |
| 17,966 | 953
超级会员免费看
订阅专栏 解锁全文
554

被折叠的 条评论
为什么被折叠?



