负关联规则与可靠异常挖掘解析
1. 负关联规则的兴趣度度量与定义
在关联规则挖掘中,我们采用如下公式来度量规则 $X \to Y$ 的置信度:
$PR(Y |X) = \frac{p(Y |X) - p(Y)}{1 - p(Y)}$,或者当 $supp(X \cup Y) \geq supp(X)supp(Y)$ 且 $supp(X)(1 - supp(Y)) \neq 0$ 时,$PR(Y |X) = \frac{supp(X \cup Y) - supp(X)supp(Y)}{supp(X)(1 - supp(Y))}$。
基于此度量,我们给出关联规则兴趣度的定义:
设 $I$ 是数据库 $TD$ 中的项集,$i = A\cup B \subseteq I$ 是项集,且 $A\cap B = \varnothing$,$supp(A) \neq 0$,$supp(B) \neq 0$,用户或专家给定 $minsupp$、$minconf$ 和 $mininterest > 0$。
- 若 $supp(A\cup B) \geq minsupp$,$supp(A\cup B) - supp(A)supp(B) \geq mininterest$,且 $PR(B|A) \geq minconf$,则 $A \to B$ 可作为有兴趣的规则被提取。
- 若 $supp(A \cup \neg B) \geq minsupp$,$supp(A) \geq minsupp$,$supp(B) \geq minsupp$,$supp(A \cup \neg B) - supp(A)supp(\neg B) \geq mininterest$,且 $PR(\neg
超级会员免费看
订阅专栏 解锁全文
962

被折叠的 条评论
为什么被折叠?



