45、不确定频繁模式挖掘技术解析

不确定频繁模式挖掘技术解析

1. 不确定频繁模式挖掘基础

在不确定数据挖掘领域,我们常常会遇到概率数据集。以概率数据集 D2 为例,挖掘出的部分模式及其相关信息如下表所示:
| 模式 X | expSup(X, D2) | 基于事务上限的 expSup(X, D2) | 基于前缀项上限的 expSup(X, D2) |
| ---- | ---- | ---- | ---- |
| {a, c} | 1.16 | 1.62 | 1.44 |
| {a, d} | 0.84 | 0.96 | 0.84 |
| {b, d} | 0.79 | 0.96 | 0.96 |
| {c, d} | 0.54 | 0.54 | 0.54 |
| {a, c, e} | 0.22 | 0.72 | 0.27 |

此外,还有项目的期望支持度信息:
| 项目 | 期望支持度 |
| ---- | ---- |
| a | 2.3 |
| d | 1.4 |
| e | 1.0 |
| b | 2.2 |
| c | 1.8 |

在挖掘受限频繁模式时,U - FIC 算法会利用可转换约束的特性。它会根据与约束相关的属性值的单调顺序来排列 UF - tree 中的域项。这样做的好处是,对于满足可转换单调(COM)约束 CCOM 的模式的所有扩展,都能保证满足该约束,无需进行额外的约束检查;同时,对于违反可转换反单调(CAM)约束 CCAM 的模式及其扩展,会进行剪枝处理。通过利用用户指定的约束,U - FPS 和 U - FIC 的计算量与约束的选择性成正比。 <

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值