44、不确定大数据上预期支持度的上界分析

不确定大数据上预期支持度的上界分析

1. 算法基础概念

在处理不确定大数据时,为了挖掘频繁项集,需要对预期支持度设定合适的上界。以下是几个关键概念:
- 预定义最大概率 :$PM1(y_r, t_j) = \max_{i\in[1,r - 1]} P(y_i, t_j)$,表示在 ${y_1, \ldots, y_{r - 1}} \subset t_j$ 中的最高存在概率。
- PUF - growth 算法 :利用预定义项上限来近似 2 - 项集预期支持度的紧密上界。
- PUF* - growth 算法 :对于 3 + 项集,$PUF^ (X, t_j)$ 的计算方式如下:
- 当 $k \leq 2$ 时,$PUF^
(X, t_j) = PIC(X, t_j)$;
- 当 $k \geq 3$ 时,$PUF^ (X, t_j) = P(x_k, t_j) \times PM1(y_r, t_j) \times [PM2(y_r, t_j)]^{k - 2}$,其中 $PM2(y_r, t_j) = \max_{i\in[1,r - 1]\land(i\neq g)} P(y_i, t_j)$,$y_g = \arg\max_{i\in[1,h]} P(y_i, t_j)$。
-
BLIMP - growth 算法 *:对于 3 + 项集,$BLIMP(X, t_j)$ 的计算方式如下:
- 当 $k \leq 2$ 时,$BLIMP(X, t_j) = PIC(X

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值