在并行点过程中寻找频繁模式
1. 引言
在并行点过程中寻找频繁模式,也被称为在事件序列中寻找频繁并行情节。这一任务可看作是频繁项集挖掘(FIM)的推广。在FIM中,项在同一事务中共同出现,而在我们的场景里,数据基于连续的(时间)尺度,项(或事件)在用户定义的有限(时间)跨度内共同出现才被视为共现。
该任务的主要问题在于,由于缺乏自然的事务划分,计算共现次数(即确定项集的支持度)并非易事。我们采用最大独立集方法,该方法使支持度具有反单调性,这一特性对高效搜索频繁模式至关重要,因为它蕴含了先验性质,能有效剪枝搜索空间。尽管最大独立集问题在一般情况下是NP完全问题,但在我们的场景中,由于问题实例受一维连续时间尺度的限制,可以高效求解。
我们的研究动机源于神经生物学中并行尖峰序列的分析,目标是识别神经元集合,即倾向于同步放电的神经元组。
2. 事件序列与并行情节
我们的数据是有限的事件序列,形式为 $S = {⟨e_1, t_1⟩, …, ⟨e_k, t_k⟩}$,其中 $e_i$ 是事件类型,$t_i$ 是事件发生的时间,且序列按时间排序。这些数据也可表示为并行点过程 $L = {(a_1, [t^{(1)} 1, …, t^{(1)} {k_1}]), …, (a_m, [t^{(m)} 1, …, t^{(m)} {k_m}])}$。
情节定义为事件类型集合,并行情节对其元素的相对顺序无约束。并行情节 $A ⊆ E$ 在序列 $S$ 中相对于时间跨度 $w$ 的实例,是 $S$ 的一个子序列 $R$,其中每个事件类型 $a ∈ A$ 恰好有一个事件,且任意两个事件的时间距离至
超级会员免费看
订阅专栏 解锁全文
1567

被折叠的 条评论
为什么被折叠?



