关联规则挖掘:从基础到创新
在数据挖掘领域,关联规则挖掘一直是一个备受关注的研究方向。它能够帮助我们发现数据中隐藏的关系,为决策提供有力支持。下面将详细介绍关联规则挖掘的相关技术和方法。
1. FP - 树模型
传统的频繁模式挖掘通常采用类似 Apriori 的候选集生成 - 测试方法。然而,这种方法在处理大量模式和长模式时,候选集生成的成本很高。为了克服这一困难,提出了基于频繁模式树(FP - 树)的频繁模式挖掘模型。
1.1 FP - 树的定义
FP - 树是一种树结构,其组成如下:
- 一个标记为 “null” 的根节点。
- 一组作为根节点子节点的项前缀子树。
- 一个频繁项头表。
项前缀子树中的每个节点包含三个字段:
| 字段 | 说明 |
| ---- | ---- |
| 项名称 | 记录该节点代表的项 |
| 计数 | 记录到达该节点的路径所代表的事务数量 |
| 节点链接 | 链接到 FP - 树中具有相同项名称的下一个节点,如果没有则为 null |
频繁项头表中的每个条目包含两个字段:
| 字段 | 说明 |
| ---- | ---- |
| 项名称 | |
| 节点链接头 | 指向 FP - 树中携带该项名称的第一个节点 |
1.2 FP - 树模型的处理过程
- 构建 FP - 树 :这是一个扩展的前缀树结构,存储频繁模式的关键定量信息。只有频繁的长度为 1 的项在树中有节点,并且
超级会员免费看
订阅专栏 解锁全文
1135

被折叠的 条评论
为什么被折叠?



