16、在并行点过程中寻找频繁模式

time3

于 2025-09-11 14:24:25 发布

阅读量9

点赞数

CC 4.0 BY-SA版权

分类专栏：智能数据分析前沿探秘文章标签：并行点过程频繁模式挖掘最大独立集

本文链接：https://blog.youkuaiyun.com/time3/article/details/153682011

智能数据分析前沿探秘专栏收录该内容

56 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

在并行点过程中寻找频繁模式

1. 引言

在并行点过程中寻找频繁模式，也被称为在事件序列中寻找频繁并行情节。这一任务可看作是频繁项集挖掘（FIM）的推广。在FIM中，项在同一事务中共同出现，而在我们的场景里，数据基于连续的（时间）尺度，项（或事件）在用户定义的有限（时间）跨度内共同出现才被视为共现。

该任务的主要问题在于，由于缺乏自然的事务划分，计算共现次数（即确定项集的支持度）并非易事。我们采用最大独立集方法，该方法使支持度具有反单调性，这一特性对高效搜索频繁模式至关重要，因为它蕴含了先验性质，能有效剪枝搜索空间。尽管最大独立集问题在一般情况下是NP完全问题，但在我们的场景中，由于问题实例受一维连续时间尺度的限制，可以高效求解。

我们的研究动机源于神经生物学中并行尖峰序列的分析，目标是识别神经元集合，即倾向于同步放电的神经元组。

2. 事件序列与并行情节

我们的数据是有限的事件序列，形式为 $S = {⟨e_1, t_1⟩, …, ⟨e_k, t_k⟩}$，其中 $e_i$ 是事件类型，$t_i$ 是事件发生的时间，且序列按时间排序。这些数据也可表示为并行点过程 $L = {(a_1, [t^{(1)} 1, …, t^{(1)} {k_1}]), …, (a_m, [t^{(m)} 1, …, t^{(m)} {k_m}])}$。

情节定义为事件类型集合，并行情节对其元素的相对顺序无约束。并行情节 $A ⊆ E$ 在序列 $S$ 中相对于时间跨度 $w$ 的实例，是 $S$ 的一个子序列 $R$，其中每个事件类型 $a ∈ A$ 恰好有一个事件，且任意两个事件的时间距离至