定量串行情节树的提取
在数据挖掘领域,对事件序列中情节的分析是一个重要的研究方向。传统的情节挖掘主要关注事件的顺序关系,而本文将介绍一种扩展的情节概念——定量情节,它不仅考虑事件的顺序,还包含了事件之间的时间间隔信息。通过构建定量情节树,我们可以更深入地了解事件序列中情节的发生模式和时间特征。
1. 初步定义
1.1 事件、事件序列和子序列关系
- 事件 :事件是一个由事件类型 $e$ 和时间戳 $t$ 组成的对 $(e, t)$,其中 $e$ 属于事件类型集合 $E$,$t$ 属于自然数集合 $N$。
- 事件序列 :事件序列 $S$ 是一个事件的元组 $S = \langle (e_1, t_1), (e_2, t_2), \ldots, (e_l, t_l) \rangle$,满足对于所有 $i \in {1, \ldots, l - 1}$,有 $t_i < t_{i + 1}$ 或者 $(t_i = t_{i + 1} \land e_i \prec e_{i + 1})$。
- 子序列关系 :给定两个事件序列 $S$ 和 $S’$,如果 $S’$ 等于 $S$ 或者 $S’$ 可以通过从 $S$ 中移除一些元素得到,则称 $S’$ 是 $S$ 的子序列,记为 $S’ \sqsubseteq S$。
1.2 情节、出现、最小出现和支持度
- 情节 :情节是一个非空的元组 $\alpha = \l
超级会员免费看
订阅专栏 解锁全文
650

被折叠的 条评论
为什么被折叠?



