22、关联规则挖掘：多层次、多维与定量规则探索

最新推荐文章于 2025-09-03 14:36:55 发布

aa123

最新推荐文章于 2025-09-03 14:36:55 发布

阅读量40

点赞数

CC 4.0 BY-SA版权

分类专栏：数据挖掘：从入门到精通文章标签：关联规则挖掘多层次关联规则多维关联规则

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/aa123/article/details/149365075

数据挖掘：从入门到精通专栏收录该内容

61 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

关联规则挖掘：多层次、多维与定量规则探索

1. 高效挖掘闭频繁项集

当当前项集 Sc 能被另一个已找到的闭频繁项集 Sa 包含时，满足以下三个条件：
- Sc 和 Sa 具有相同的支持度。
- Sc 的长度小于 Sa 的长度。
- Sc 中的所有项都包含在 Sa 中。

基于此特性，可以构建一个两级哈希索引结构来快速访问模式树：
- 第一级使用 Sc 中最后一项的标识符作为哈希键（因为该标识符必定在 Sc 的分支内）。
- 第二级使用 Sc 的支持度作为哈希键（因为 Sc 和 Sa 支持度相同）。

这能显著加速子集检查过程。

2. 挖掘多层次关联规则

在许多应用中，由于低抽象级别数据的稀疏性，很难在这些级别找到数据项之间的强关联。而在高抽象级别发现的强关联可能代表常识性知识，且不同用户对常识的认知可能不同。因此，数据挖掘系统应具备在多个抽象级别挖掘关联规则的能力，并能灵活遍历不同抽象空间。

2.1 示例数据与概念层次结构

假设有一个 AllElectronics 商店的销售事务数据，如下表所示：
| TID | Items Purchased |
| — | — |
| T100 | IBM - ThinkPad - T40/2373, HP - Photosmart - 7660 |
| T200 | Microsoft - Office - Professional - 2003, Microsoft - Plus! - Digital - Media |
| T300 | Logitech

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。