因果关系的多项式函数解析
1. 因果规则优化与合并
在因果规则分析中,对于不必要信息的处理十分关键。具体操作步骤如下:
1. 找出所有满足 $p(y_j|x_{i_k}) \geq \text{minconf}$(其中 $1 \leq j \leq m$ 且 $k = 1, 2, \cdots, t$)的行 $i_1, i_2, \cdots, i_t$。
2. 若 $t > 1$,将所有行 $i_1, i_2, \cdots, i_t$ 合并到行 $i_1$,并从 $M_{Y|X}$ 中删除行 $i_2, \cdots, i_t$。
合并具有相同属性的定量项的算法与上述减少不必要信息的过程类似。可以证明,合并列以减少不必要信息是合理的。
对于给定的大型数据库 $D$、最小支持度 $\text{minsupp}$ 和最小置信度 $\text{minconf}$,如果 $X \to Y$ 作为规则被提取出来,那么它是一个优化规则,具体分为以下两种情况:
- 若 $X$ 和 $Y$ 是项集或定量项,$X \to Y$ 肯定是优化规则。
- 若 $X$ 和 $Y$ 是项变量,规则会附带一个条件概率矩阵 $M_{Y|X}$。在矩阵的行和列中,会合并 $M_{Y|X}$ 中的不必要信息以及具有相同属性的项。因此,减少不必要信息后,$M_{Y|X}$ 是一个最优矩阵,即 $X \to Y$ 是优化规则。
当应用因果规则时,合并后的点值概率会相加,作为新点值的概率,以此替代合并的点值。例如,对于 $M_{Y|X}^1$ 的证据 $(0.7, 0.1, 0.08, 0.08, 0.02, 0.02)$,若用于 $M_{Y|X}^3
超级会员免费看
订阅专栏 解锁全文
30

被折叠的 条评论
为什么被折叠?



