20、超大型数据库关联规则挖掘与优化

超大型数据库关联规则挖掘与优化

1. 增量挖掘中的项目集处理

在增量挖掘过程中,项目集的处理至关重要。对于新的增量数据集,会根据特定操作更新项目集的支持度。例如,对于项目集 A,其加权支持度 suppw(A) = w1∗mincruc/2 + w2∗supp(A+) 。假设 w1 = 0.75,mincruc = 0.3,w2 = 0.25,supp(A+) = 0.64 ,则 suppw(A) = 0.75∗0.15 + 0.25∗0.64 = 0.2725 。由于该值小于 mincruc(假设为 0.3),项目集 A 不能被添加到竞争集 CS 中,但它大于 mincruc/2 = 0.15 。随着增量数据集的增加,项目集 A 的支持度可能会发生变化,有可能成为频繁项目集。我们使用 CS′ 来捕捉增量数据集中项目集的这一特性。项目集 A 支持度的变化如下:
- supp(A) < 0.3
- → 0.15 ∗ 0.75 + 0.64 ∗ 0.25 = 0.2725
- → A (supp(A) = 0.2725)⇒ CS′
- → 0.2725 ∗ 0.75 + 0.64 ∗ 0.25 = 0.364375
- → A (supp(A) = 0.2725)⇒ CS
- → 0.364375 ∗ 0.75 + 0.64 ∗ 0.25 = 0.43328
- → 0.43328 ∗ 0.75 + 0.64 ∗ 0.25 = 0.48496
- → 0.48496 ∗ 0.75 + 0.64 ∗ 0.25 = 0.52372
- → 0.52372 ∗ 0.75 + 0.64 ∗ 0.25 = 0.55279
- →

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值