数据挖掘中的负关联规则与因果关系
在数据挖掘领域,负关联规则和因果关系的挖掘是两个重要的研究方向。它们对于商业决策、问题解决等方面具有重要意义。下面将详细介绍负关联规则和因果关系挖掘的相关内容。
负关联规则
在挖掘负关联规则时,我们常常会发现一些弱模式,这些模式具有低支持度但高置信度。为了确定哪些子项集应包含在最终的可靠异常中,我们可以采用一种简单的方法。假设在窗口中发现的强关联规则里,子项集 X 不包含任何负偏差属性,我们可以比较 X 在窗口中的支持度 supwin 及其在整个数据中的对应支持度 supwho 。实际上,我们真正要检查的是关于 X → c 的窗口中的 P(X, c) 和整个数据中的 P(X) ,它们的比率就是置信度。如果 supwin - confwho 足够大(因为 confwin 总是 1,大的差值意味着低的 confwho ),那么我们可以认为 X 的高置信度是窗口特有的;否则,X 没有足够的证据被包含在最终的可靠异常中。
为了更好地理解负关联规则的挖掘方法,我们将提出的 PR 模型与其他几种模型进行比较:
1. 与支持 - 置信度框架(SCF)的比较
- SCF 模型 :通常在数据库中生成关联规则,但其中一些规则可能没有实际意义,并且该模型只处理频繁项集。
- PR 模型 :能
负关联规则与因果关系挖掘
超级会员免费看
订阅专栏 解锁全文
1565

被折叠的 条评论
为什么被折叠?



