20、超大型数据库关联规则挖掘与优化

最新推荐文章于 2025-10-18 15:01:17 发布

杠精协会主席

最新推荐文章于 2025-10-18 15:01:17 发布

阅读量23

点赞数

CC 4.0 BY-SA版权

分类专栏：关联规则挖掘的艺术文章标签：关联规则挖掘增量挖掘加权支持度

本文链接：https://blog.youkuaiyun.com/docker7nomad/article/details/153464299

关联规则挖掘的艺术专栏收录该内容

24 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

超大型数据库关联规则挖掘与优化

1. 增量挖掘中的项目集处理

在增量挖掘过程中，项目集的处理至关重要。对于新的增量数据集，会根据特定操作更新项目集的支持度。例如，对于项目集 A，其加权支持度 suppw(A) = w1∗mincruc/2 + w2∗supp(A+) 。假设 w1 = 0.75，mincruc = 0.3，w2 = 0.25，supp(A+) = 0.64 ，则 suppw(A) = 0.75∗0.15 + 0.25∗0.64 = 0.2725 。由于该值小于 mincruc（假设为 0.3），项目集 A 不能被添加到竞争集 CS 中，但它大于 mincruc/2 = 0.15 。随着增量数据集的增加，项目集 A 的支持度可能会发生变化，有可能成为频繁项目集。我们使用 CS′ 来捕捉增量数据集中项目集的这一特性。项目集 A 支持度的变化如下：
- supp(A) < 0.3
- → 0.15 ∗ 0.75 + 0.64 ∗ 0.25 = 0.2725
- → A （supp(A) = 0.2725）⇒ CS′
- → 0.2725 ∗ 0.75 + 0.64 ∗ 0.25 = 0.364375
- → A （supp(A) = 0.2725）⇒ CS
- → 0.364375 ∗ 0.75 + 0.64 ∗ 0.25 = 0.43328
- → 0.43328 ∗ 0.75 + 0.64 ∗ 0.25 = 0.48496
- → 0.48496 ∗ 0.75 + 0.64 ∗ 0.25 = 0.52372
- → 0.52372 ∗ 0.75 + 0.64 ∗ 0.25 = 0.55279
- →