序列中挖掘部分顺序的方法与算法
1. 频繁模式的定义与关系
1.1 顺序模式与闭顺序模式
对于字符串 $s$,$sup(s)$ 表示字符串数据库 $SDB$ 中包含 $s$ 作为子字符串的字符串数量。若 $sup(s) \geq min\ sup$,则 $s$ 是一个顺序模式,即对项目子集的频繁全序。若不存在 $s$ 的真超序列 $s’$ 使得 $sup(s’) = sup(s)$,则 $s$ 是一个闭顺序模式。
1.2 图模式与闭图模式
由于字符串定义了一个全序,其传递闭包可视为有向无环图(DAG)。对于 DAG $G$,$sup(G)$ 是包含 $G$ 作为嵌入子图的图的数量。若 $sup(G) \geq min\ sup$,则 $G$ 是一个频繁图模式。若不存在图 $G’$ 使得 $sup(G) = sup(G’)$ 且 $G$ 是 $G’$ 的嵌入子图,则 $G$ 是一个频繁闭图模式。
1.3 频繁模式之间的关系
- 频繁部分顺序与频繁项集和顺序模式 :频繁部分顺序中的项目集是频繁项集。若 $R$ 是频繁部分顺序,则 $R$ 中的每条路径 $s$ 都是顺序模式。
- 频繁闭部分顺序与闭顺序模式 :设 $R$ 是频繁闭部分顺序,$s_1, \ldots, s_k$ 是 $R$ 的传递闭包图中从源到汇的所有路径。则字符串 $s$ 支持 $R$ 当且仅当它同时支持 $s_1, \ldots, s_k$。
- 部分顺序与传递闭包图模式 :部分顺序
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



