37、基于快速树的不确定数据频繁项集挖掘

h0i1j2k3l

于 2025-09-23 16:55:06 发布

阅读量11

点赞数

CC 4.0 BY-SA版权

分类专栏：探索XML数据查询新范式文章标签：不确定数据频繁项集挖掘 CUF-growth

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/h0i1j2k3l/article/details/154169184

探索XML数据查询新范式专栏收录该内容

75 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基于快速树的不确定数据频繁项集挖掘

在处理不确定数据时，频繁项集挖掘是一项重要的任务。本文将介绍两种相关算法：CUF - growth 和 CUF - growth*，并通过实验对比它们与现有算法的性能。

1. CUF - growth 算法

CUF - growth 算法用于从 CUF - tree 中挖掘频繁项集，它处理的是事务上限（transaction caps），而非像 FP - growth 算法那样处理出现频率。其基本操作是构建投影数据库并递归挖掘频繁项集的扩展。

1.1 相关性质和引理

性质 1 ：要计算所有后缀为 x 的潜在频繁项集，只需累积 CUF - tree 中标记为 x 的节点的前缀子路径。路径上每个节点的事务上限与路径中对应节点 x 的事务上限相同。
引理 4 ：设 X 是数据库 DB 中的一个 k - 项集（k ≥ 1），DBX 是 X - 投影数据库，Y 是 DBX 中的一个项集。那么，DB 中 X ∪ Y 的预期支持上限（expSupCap(X ∪ Y)）等同于 DBX 中事务的 Y 的预期支持上限（expSupCap(Y)）。

1.2 算法流程

以下是 CUF - growth 算法的伪代码：

Algorithm 2: Mining of “frequent” itemsets by CUF - growth
Input: A CUF - tree capturin

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。