关联规则集结构:理论、算法与实验分析
1. 可消除项集的识别
对于任意的 $R⊂S$,存在以下重要性质:
- 等价关系 :$R ∈ N(S) ⇔ ρ(S\R )⊆ ρ(R) ⇔ h(S) = h(S\R) ⇔ supp(S) = supp(S\R) ⇔ P(ρ(S\R)\ρ(S)) = 0$。
- $N(S)$ 的表示 :
- $N(S) = {A: A ⊆ S\G0, G0 ∈ G(S)}$。
- $N(S) = \bigcup_{G0∈G(S)} N(S, G0)$,其中 $N(S, G0) = {A: A⊆S\G0}$。
例如,给定数据库 $T$,以及项集 $A = {a, b, c, d, e, f, g, h}$ 被划分为九个不相交的等价类。当 $X=aceg$ 时,$G(X) = {ae, ag}$,$[X] = {ae, ag, ace, acg, aeg, aceg}$,且支持度均为 $0.25$,$N^ (X, ae) = {cg, c, g}$,$N^ (X, ag)={ce, c, e}$,$N^ (X) = N^ (X, ae) ∪ N^*(X, ag) = {cg, c, g, e, ce}$。
2. 具有相同闭包的项集的唯一表示
- 等价类的定义 :对于非空项集 $X⊆A$,定义等价类 $⎣X⎦ = {X’⊆X | X’≠∅, h(X’)=h(X)}$ 或 $⎣X⎦ = {X’⊆X | X’∈[X]{∅}}$。
超级会员免费看
订阅专栏 解锁全文
2152

被折叠的 条评论
为什么被折叠?



