39、事件类型序列相似度分析-优快云博客

本文链接：https://blog.youkuaiyun.com/julia4scientist/article/details/154420916

事件类型序列相似度分析

1. 基本概念

在对事件进行建模时，一种现实的方法是考虑一组事件属性 $R = {A_1, \cdots, A_k}$，每个属性都有其对应的域 $Dom(A_1), \cdots, Dom(A_k)$。一个事件可以表示为一个 $(k + 1)$ 元组 $(a_1, \cdots, a_k, t)$，其中 $a_i \in Dom(A_i)$，$t$ 是事件的发生时间，为一个实数。事件序列则是在 $R \cup {T}$ 上的一组事件集合，属性 $T$ 的域是实数集 $\mathbb{R}$，并且事件序列中的事件按照发生时间 $t$ 升序排列。

例如，在电信领域，事件可能具有警报类型、模块和严重程度等属性，分别表示警报的类型、发送警报的模块以及警报的严重程度；在网络日志中，事件可能具有页面（请求的页面）、主机（访问的主机）和请求的发生时间等属性。

为了简化研究，通常只考虑事件的类型和发生时间。设 $E$ 为事件类型的集合，那么一个事件可以表示为一个对 $(e, t)$，其中 $e \in E$ 是事件的类型，$t \in \mathbb{R}$ 是事件的发生时间。事件序列 $S$ 则是一组有序的事件集合，即 $S = \langle (e_1, t_1), (e_2, t_2), \cdots, (e_n, t_n) \rangle$，其中 $e_i \in E$，且对于所有的 $i = 1, \cdots, n - 1$，有 $t_i \leq t_{i + 1}$。序列 $S$ 的长度为 $|S| = n$。

我们还可以考虑更简化的序列，即只包含按时间顺序排列的事件类型的序列，这样的序列 $S = \langle e_1, e_2,