模糊关联规则与聚类及关联规则挖掘的性能优化
在当今大数据时代,从海量数据中挖掘有价值的信息变得至关重要。数据挖掘中的关联规则挖掘是一个重要的研究领域,它可以帮助我们发现数据中隐藏的模式和关系。本文将介绍模糊关联规则、聚类以及关联规则挖掘的性能优化等相关内容。
模糊关联规则与聚类
模糊关联规则可以被视为一种特殊的聚类,它跨越了两个不同的子空间。假设 $r$ 是模式 $R$ 的一个实例,$X$ 和 $Y$ 是 $R$ 的子集。设 $D_x$ 和 $D_y$ 分别是 $X$ 和 $Y$ 上的度量。若使用定义 $\beta$ 作为模糊关联规则的定义,$D_x$ 和 $D_y$ 作为 $X$ 和 $Y$ 上的度量,蕴含强度为 $c > 0$,规则库质量为 $\delta > 0$,支持度阈值为 $\alpha$,置信度阈值为 $\gamma$。
设 $S$ 是 $r$ 中满足模糊关联规则 $S[X] \Rightarrow S[Y]$ 的元组集合,即对于任意 $p_i, p_j \in S$,$p_i$ 和 $p_j$ 满足:$D_x(p_i[X]; p_j[X]) < \delta$,$c \times D_y(p_i[Y]; p_j[Y]) < D_x(p_i[X]; p_j[X])$,且 $|S[XY]| = s > \alpha$。如果取 $\delta_{cluster} = \max{\delta, \delta/c}$ 且 $\alpha_{cluster} = |S[XY]|$,那么 $S[XY]$ 也是在定义 $\Delta$ 下,参数为 $\delta_{cluster}$ 和 $\alpha_{cluster}$ 的一个聚类。这种模糊关联
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



