高效挖掘不确定数据库中加权频繁项集的HEWI - Utree算法
1 算法核心结构与概念
1.1 1 - 项的E表与WP表构建
首先构建了1 - 项的E表和WP表,以下是相关数据:
| 项集 | 权重 | 期望支持度 |
| — | — | — |
| (A) | 0.400 | 2.380 |
| (B) | 0.700 | 4.870 |
| (C) | 1.000 | 4.750 |
| (D) | 0.550 | 5.700 |
| (E) | 0.850 | 2.100 |
| (F) | 0.300 | 3.450 |
项的权重顺序为:w(C) > w(E) > w(B) > w(D) > w(A) > w(F)。
1.2 WP树相关定义
- 定义10 :设计的加权概率(WP)树中项的总顺序 ≺ 是1 - 项的权重降序顺序。
- 定义11 :项集关于节点X的扩展可以通过将项y附加到X来获得,使得根据总顺序 ≺,y大于X中已有的所有项。
1.3 WP树的性质及引理
- 引理1 :所提出的HEWI - Utree算法的搜索空间可以由一个WP树表示,其中项根据发现的HUBEWI1的权重降序排序。
- 引理2 :在WP树中,一个节点的权重不小于其任何子节点
超级会员免费看
订阅专栏 解锁全文
9

被折叠的 条评论
为什么被折叠?



