模糊关联规则:从基础到应用的全面解析
在数据挖掘领域,关联规则挖掘是一项重要的技术,它能够帮助我们发现数据集中不同项目之间的潜在关系。本文将深入探讨模糊关联规则的相关概念,包括其通用形式、测量方法、与模糊依赖关系和聚类的联系等。
1. 关联规则的几何视角
在关联规则挖掘的讨论中,超市购物篮数据是常用的示例。一个购物篮数据集由大量的购物记录组成。假设在布尔关联规则挖掘问题中,支持度阈值设为 100,置信度阈值设为 70%。若有 1200 位顾客购买了蛋糕粉,其中 1000 位顾客同时购买了蛋糕粉和蛋糕糖霜,那么“(蛋糕粉) -> (蛋糕糖霜)”就是一个布尔关联规则,其支持度为 1000,置信度为 1000 / 1200 ≈ 83.3%。
这个规则在 XY 空间中有几何解释。对于 X,用 1 表示包含蛋糕粉的购物记录;对于 Y,用 1 表示“购买蛋糕糖霜”,0 表示“不购买蛋糕糖霜”。该规则涉及两个点 (1, 1) 和 (1, 0)。支持度 1000 从几何上解释,意味着在 XY 空间中有 1000 个重叠的点 (1, 1);置信度 83.3% 表示在 X 子空间投影为 1 的所有点中,有 83.3% 的点位于 (1, 1)。
更一般地,一个数据集 r(如购物篮数据集)可以看作是 m 维空间 R = {X₁, X₂, …, Xₘ} 中的一组点。在购物篮数据的情况下,m 是超市中不同商品的数量。一个属性或一组属性可以看作是 R 的子空间。设 A -> B 是一个关联规则,其中 A 和 B 是 R 某些子空间中的单个值或向量,A 在子空间 X(⊆ R,X 表示市场中一部分商品),B 在子空间 Y(⊆ R)。从概念上讲,有两组坐标轴,一组用于 X,一组用于
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



