危机信息相关性分类与高效事件流时间推理
在当今信息爆炸的时代,处理大量数据并从中提取有价值信息对于许多领域至关重要。特别是在危机信息处理和事件流时间推理方面,如何准确分类危机信息以及高效处理事件流中的时间关系,成为了研究的热点。本文将介绍两种相关的技术方法,一是通过融合语义和统计特征来分类危机信息,二是提出一种新的流推理模型 DOTR 以进行高效的事件流时间推理。
危机信息相关性分类
在危机信息处理中,准确分类危机相关和不相关的帖子对于及时响应危机至关重要。传统的统计特征分类器在处理已知类型的危机事件时表现尚可,但在面对新类型的危机事件时,其性能往往受到限制。
为此,研究人员提出了一种混合方法,将语义特征与统计特征相结合。实验结果表明,这种混合方法在处理新类型危机事件时,分类性能有显著提升。具体来说,在 15 个事件中,SF + SemEF BNDB 模型在 9 个事件上相对于基线有改进,F1 分数平均提高了 +2.64%。而在 5 个未显示改进的事件中,有 2 个事件的百分比损失(ΔF/F)为 -0.34% 和 -0.56%。
在比较语义特征和统计特征时,发现语义特征(特别是来自 DBpedia 的特征)在分类器在训练期间未见过的事件类型上,能够增强分类性能。这表明语义特征在处理新类型危机事件时比统计特征更具鲁棒性。
此外,通过对被错误分类的推文进行分析,还发现了语义特征的一些特点:
- 语义可以对事件特定术语进行泛化,从而适应新的事件类型。例如,将“dbc:flood”和“dbc:natural hazard”进行关联。
- 语义概念有时可能过于宽泛,对文档分类没有帮助。例如,“desire”和“virtue”的上位
超级会员免费看
订阅专栏 解锁全文
66

被折叠的 条评论
为什么被折叠?



