38、不确定数据挖掘与身份知识表示研究

h0i1j2k3l

于 2025-09-24 09:40:40 发布

阅读量11

点赞数

CC 4.0 BY-SA版权

分类专栏：探索XML数据查询新范式文章标签：不确定数据挖掘频繁项集挖掘 UF-growth

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/h0i1j2k3l/article/details/154169189

探索XML数据查询新范式专栏收录该内容

75 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

不确定数据挖掘与身份知识表示研究

1. 不确定数据频繁项集挖掘

在不确定数据频繁项集挖掘领域，已经提出了多种算法。
- UF - growth 算法 ：该算法构建的 UF - 树可能会很大，因为只有当节点的 ⟨项，存在概率值⟩ 完全相同时，节点才会共享。
- UFP - growth 算法 ：为了减少树节点的数量，UFP - growth 算法将具有相同项但存在概率值相似的节点进行聚类。不过，与 UF - growth 这个精确算法不同，UFP - growth 是一个近似算法，可能会产生误报。

为了进一步减少树节点数量（相较于 UF - 树）和误报（相较于 UFP - growth），提出了 CUF - growth 和 CUF - growth 算法：
- CUF - growth 算法 ：通过在 CUF - 树中捕获上限（即事务中两个最高存在概率值的乘积），该算法为项集的期望支持度提供了一个严格的上限，从而减少了误报数量。它能在保持 CUF - 树节点数量与 FP - 树相同的情况下，高效地找到频繁项集。
- CUF - growth 算法**：该算法通过保留事务中项的第三高存在概率，进一步减少了误报数量，使得在从不确定数据中挖掘频繁项集时，项集的期望支持度上限更严格。

以下是几种算法的对比表格：
| 算法 | 树节点数量 | 误报情况 | 算法性质 |
| ---- | ---- | ---- | ---- |
| UF - growth |

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。