6、关联规则挖掘:从基础到创新

关联规则挖掘:从基础到创新

在数据挖掘领域,关联规则挖掘一直是一个备受关注的研究方向。它能够帮助我们发现数据中隐藏的关系,为决策提供有力支持。下面将详细介绍关联规则挖掘的相关技术和方法。

1. FP - 树模型

传统的频繁模式挖掘通常采用类似 Apriori 的候选集生成 - 测试方法。然而,这种方法在处理大量模式和长模式时,候选集生成的成本很高。为了克服这一困难,提出了基于频繁模式树(FP - 树)的频繁模式挖掘模型。

1.1 FP - 树的定义

FP - 树是一种树结构,其组成如下:
- 一个标记为 “null” 的根节点。
- 一组作为根节点子节点的项前缀子树。
- 一个频繁项头表。

项前缀子树中的每个节点包含三个字段:
| 字段 | 说明 |
| ---- | ---- |
| 项名称 | 记录该节点代表的项 |
| 计数 | 记录到达该节点的路径所代表的事务数量 |
| 节点链接 | 链接到 FP - 树中具有相同项名称的下一个节点,如果没有则为 null |

频繁项头表中的每个条目包含两个字段:
| 字段 | 说明 |
| ---- | ---- |
| 项名称 | |
| 节点链接头 | 指向 FP - 树中携带该项名称的第一个节点 |

1.2 FP - 树模型的处理过程
  • 构建 FP - 树 :这是一个扩展的前缀树结构,存储频繁模式的关键定量信息。只有频繁的长度为 1 的项在树中有节点,并且
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值