信息传播评估与自动术语提取方法研究
1. 信息传播评估:Hawkes 过程的应用与局限
在信息传播研究中,Hawkes 过程被用于评估 Reddit 上的信息传播情况。然而,当前形式的 Hawkes 过程在理解 Reddit 信息传播方面的效用可能有限,未来需要对该方法进行扩展或修改。
1.1 潜在改进方法
- 直接统计链接出现次数 :当前方法是比较特定链接与其他链接或文本的发布次数,而直接报告链接出现的次数,而非进行百分比比较,能够直接评估信息的传播情况。例如,在目标子版块中发现链接出现两到三次,就可以返回一个代表出现情况的行为三元组。
- 重新定义事件 :可以将事件定义为在第二个子版块中发现来自第一个子版块的任何链接的时刻,而不是计算每个单独链接行为的平均值。
1.2 用户重叠情况统计
另一种可能的扩展是统计用户重叠程度。如果用户重叠较少,就不太可能出现跨帖子发布的情况。可以使用 RedditMetis 工具提取用户本身及其活动的信息,以便获取更多基于用户的信息,进而绘制所有可能的影响/受影响页面。
1.3 Hawkes 过程的局限性
Hawkes 算法与泊松方程类似,是一种基于时间的预测算法,用于评估事件发生的预期次数,但并非精确预测。所获得的结果是基于从真实数据中捕获的行为得出的某些事件发生的示例,因此,如果重新进行该过程,很可能不会得到相同的结果。这也意味着样本有可能无法正确反映行为,显示出的事件发生次数与所获得的变量所表明的情况相比过多或过少。
<
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



