事件类型序列相似度分析
1. 基本概念
在对事件进行建模时,一种现实的方法是考虑一组事件属性 $R = {A_1, \cdots, A_k}$,每个属性都有其对应的域 $Dom(A_1), \cdots, Dom(A_k)$。一个事件可以表示为一个 $(k + 1)$ 元组 $(a_1, \cdots, a_k, t)$,其中 $a_i \in Dom(A_i)$,$t$ 是事件的发生时间,为一个实数。事件序列则是在 $R \cup {T}$ 上的一组事件集合,属性 $T$ 的域是实数集 $\mathbb{R}$,并且事件序列中的事件按照发生时间 $t$ 升序排列。
例如,在电信领域,事件可能具有警报类型、模块和严重程度等属性,分别表示警报的类型、发送警报的模块以及警报的严重程度;在网络日志中,事件可能具有页面(请求的页面)、主机(访问的主机)和请求的发生时间等属性。
为了简化研究,通常只考虑事件的类型和发生时间。设 $E$ 为事件类型的集合,那么一个事件可以表示为一个对 $(e, t)$,其中 $e \in E$ 是事件的类型,$t \in \mathbb{R}$ 是事件的发生时间。事件序列 $S$ 则是一组有序的事件集合,即 $S = \langle (e_1, t_1), (e_2, t_2), \cdots, (e_n, t_n) \rangle$,其中 $e_i \in E$,且对于所有的 $i = 1, \cdots, n - 1$,有 $t_i \leq t_{i + 1}$。序列 $S$ 的长度为 $|S| = n$。
我们还可以考虑更简化的序列,即只包含按时间顺序排列的事件类型的序列,这样的序列 $S = \langle e_1, e_2,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



