超大型数据库关联规则挖掘与优化
1. 增量挖掘中的项目集处理
在增量挖掘过程中,项目集的处理至关重要。对于新的增量数据集,会根据特定操作更新项目集的支持度。例如,对于项目集 A,其加权支持度 suppw(A) = w1∗mincruc/2 + w2∗supp(A+) 。假设 w1 = 0.75,mincruc = 0.3,w2 = 0.25,supp(A+) = 0.64 ,则 suppw(A) = 0.75∗0.15 + 0.25∗0.64 = 0.2725 。由于该值小于 mincruc(假设为 0.3),项目集 A 不能被添加到竞争集 CS 中,但它大于 mincruc/2 = 0.15 。随着增量数据集的增加,项目集 A 的支持度可能会发生变化,有可能成为频繁项目集。我们使用 CS′ 来捕捉增量数据集中项目集的这一特性。项目集 A 支持度的变化如下:
- supp(A) < 0.3
- → 0.15 ∗ 0.75 + 0.64 ∗ 0.25 = 0.2725
- → A (supp(A) = 0.2725)⇒ CS′
- → 0.2725 ∗ 0.75 + 0.64 ∗ 0.25 = 0.364375
- → A (supp(A) = 0.2725)⇒ CS
- → 0.364375 ∗ 0.75 + 0.64 ∗ 0.25 = 0.43328
- → 0.43328 ∗ 0.75 + 0.64 ∗ 0.25 = 0.48496
- → 0.48496 ∗ 0.75 + 0.64 ∗ 0.25 = 0.52372
- → 0.52372 ∗ 0.75 + 0.64 ∗ 0.25 = 0.55279
- →
超级会员免费看
订阅专栏 解锁全文
1384

被折叠的 条评论
为什么被折叠?



