数据挖掘中的频繁模式挖掘、关联规则与分类预测
1. 频繁模式挖掘相关内容
1.1 规则约束特性证明
在频繁项集挖掘中,有不同的规则约束,其特性如下表所示:
| 规则约束 | 反单调 | 单调 | 简洁 |
| — | — | — | — |
| (v \in S) | 否 | 是 | 是 |
| (S \subseteq V) | 是 | 否 | 是 |
| (min(S) \leq v) | 否 | 是 | 是 |
| (range(S) \leq v) | 是 | 否 | 否 |
这些特性在频繁项集挖掘的规则约束中起着重要作用,不同的特性决定了在挖掘过程中如何对项集进行筛选和处理。
1.2 特定规则挖掘问题
1.2.1 免费商品触发购买规则挖掘
商店中每件商品价格非负,商店经理关注“一件免费商品可能触发同一交易中 200 美元的总购买额”这样的规则。要高效挖掘此类规则,可以按以下步骤操作:
1. 筛选出包含免费商品的交易记录。
2. 计算这些交易中除免费商品外其他商品的总价格。
3. 找出总价格达到 200 美元的交易,分析其中商品的组合模式。
1.2.2 不同约束下的关联规则挖掘
- 包含至少一个任天堂游戏 :
- 约束类型:这是一种存在性约束。
- 挖掘方法:可以先筛选出包含任天堂游戏的交易,然后在这些交易中挖掘频繁项集和关联规则。