社交媒体关键日期检测与可持续主动监测框架研究
1. 关键日期检测对比实验
为验证所提方法的有效性,设计了以下对比算法:
- Tweet Number :根据每天所选推文数量对日期进行排名。假设重要事件发生时,短期内会发布大量相关推文。
- Adam2011 :提出一种新颖的流式算法,用于发现连续事件中的突发属性,以此找到高峰日期。
- Gao2014 :先找出高峰区域,再使用DTM模型将推文划分为不同子主题,最后从每个主题中选择推文数量最多的日期。
- Chang2016 :先确定事件段数量,用生命周期模型模拟每个事件段中推文数量的变化,最后选择每个事件段的增长日期作为关键日期。
将日期按推文数量排序,选择前L个日期作为关键日期。以下是不同系统在三个事件上的实验结果:
| 数据集 | 方法 | MAP5 | MAP10 | MAP15 | MAP20 | MAP25 | MAP30 | P30 | R30 | F30 |
| — | — | — | — | — | — | — | — | — | — | — |
| 埃及 | Tweet number | 0.347 | 0.334 | 0.357 | 0.370 | 0.372 | 0.369 | 0.367 | 0.423 | 0.393 |
| | OPAD | 0.347 | 0.377 | 0.374 | 0.391 | 0.403 | 0.402 | 0.367 | 0.423 | 0.393 |
|
超级会员免费看
订阅专栏 解锁全文
1918

被折叠的 条评论
为什么被折叠?



