CLAIM:一种高效的宽松频繁闭项集挖掘方法
在数据挖掘领域,频繁闭项集挖掘是一个重要的研究方向,特别是在数据流场景下,面临着时间和空间的双重挑战。本文将介绍一种名为CLAIM的高效算法,用于解决宽松频繁闭项集的挖掘问题。
1. 相关集合定义
为了应用CLAIM算法,我们需要为每个二分图BG定义两个集合:BFu和BFl。
- BFu集合 :对于任意二分图BG = (U, L, E),其BFu由项集X组成,其中X ∉ BG,且X被U中的至少一个项集Y包含,同时不存在X′ ∉ BG,满足X′ ⊂ Y且X′ ⊃ X。其生成过程如下:
1. 对于U中长度为k的每个项集X,枚举其所有长度为(k - 1)的子集Sk−1。
2. 对于每个X′ ∈ Sk−1,如果它包含L中的项集或被BFu中的项集包含,则将其过滤掉;否则,将其插入BFu。
3. 对每个过滤后的项集继续此过程,直到生成BFu中的所有项集。
例如,对于二分图BG(= {
{abce}, {ab, be}, {e(abce, ab), e(abce,be)}}),其BFu为{ace, bc}。
- 引理2 :一个上界漂移项集X被BG包含,当且仅当X ∈ BFu。
- BFl集合 :对于任意二分图BG = (U, L, E),其BFl由项集X组成,其中X ∉ BG,且X包含L中的至少一个项集Y,同时不存在X′ ∉ BG,满足X′ ⊃ Y且X′ ⊂ X。其生成过程可模拟BFu的生成。例如,对于二分图BG(= {
{ace}, {a}, {e(
超级会员免费看
订阅专栏 解锁全文
4400

被折叠的 条评论
为什么被折叠?



