关联规则挖掘:有趣项集搜索与负关联规则分析
1. 负关联规则及有趣项集的定义
在关联规则挖掘中,负关联规则是一种重要的规则类型。若满足以下条件:
1. (A \cap B = \varnothing);
2. (supp(A) \geq minsupp),(supp(B) \geq minsupp),且 (supp(A\cup\neg B) \geq minsupp);
3. (supp(A \cup\neg B) - supp(A)supp(\neg B) \geq mininterest);
4. (supp(A \cup\neg B)/supp(A) \geq minconf)。
则 (A \to\neg B) 是一个有效的负关联规则,其中 (mininterest) 是用户指定的最小有趣值,(A \cup B) 是一个有趣的负项集。反之,若不满足这些条件,(A \to\neg B) 则不是有趣的规则,(A \cup B) 是无趣项集。无趣项集是数据库中排除了有趣的正项集和负项集的所有项集,在挖掘时需要对这些项集进行剪枝以减少搜索空间。
若 (i) 是一个有趣的负项集,那么至少存在一种表达式 (i = A \cup B),使得规则 (A \to\neg B)、(\neg A \to B) 或 (\neg A \to\neg B) 中的一个是有效的负关联规则。
2. 现有算法的问题及新算法的提出
传统的 Apriori 算法只能识别频繁项集,不包含非频繁项集。虽然它只需少量启发式信息就能搜索数据库中由项和可能项集组成的指数空间,但当频繁项集数量非常大时,该算法可能会产生较大的计算开销。因此,我
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



