关联规则挖掘:从基础到模糊拓展
1. 关联规则基础概念
关联规则挖掘是数据挖掘研究中的重要主题。在数据挖掘中,关联规则是一种描述数据项之间关系的规则。
1.1 布尔关联规则
设 (R = {a_1, a_2, \cdots, a_m}) 是一个关系模式,它是一组定义关系格式的属性(列标题)。设 (r) 是 (R) 的一个实例,即 (r) 是一个具有 (R) 属性的关系。(r) 由许多元组组成,每个元组恰好有 (m) 个条目,每个条目属于 (m) 个属性 (a_i) 中的一个,(i = 1, 2, \cdots, m)。
布尔关联规则是一种形如 (a \Rightarrow b) 的蕴含式,其中 (a) 是属性集 (X (\subseteq R)) 中的一个值或向量,(b) 是属性集 (Y (\subseteq R)) 中的一个值或向量。关联规则有支持度和置信度两个重要指标:
- 支持度 :规则 (a \Rightarrow b) 的支持度为 (s),如果在 (r) 中有 (s) 个元组在属性集 (X) 和 (Y) 中同时包含 (a) 和 (b)。
- 置信度 :规则的置信度为 (c)((c \leq 1),以百分比表示),如果所有包含 (a) 的元组中,有 (c) 比例的元组也包含 (b)。
通常,在挖掘操作开始前会给定支持度和置信度的最小阈值,只有支持度和置信度高于这些最小阈值的规则才会被选为有用规则。
1.2 定量关联规则
定量关联规则是关联规则的一种更一般形式,也称为区间关联规则。它定义为一个
超级会员免费看
订阅专栏 解锁全文
63

被折叠的 条评论
为什么被折叠?



