图结构学习中的搜索优化与算法实践
1. 分类规则与误差率降低
在相关研究中,使用了如下分类规则:若对于所有 $i \neq k$,都有 $p_kp(x|a_k) \geq p_ip(x|a_i)$,则将数字判定为 $a_k$ 类。通过使用树结构,与假设 96 个单元格内容相互独立所构建的模型相比,误差率从 0.09 降低到了 0.04。
2. Chow - Liu 树:预测方法
Chow - Liu 树的预测方法考虑先验分布和一组参数,使其能以特定形式表达,并据此构建基于观测的后验分布。对于给定的 Chow - Liu 树,其预测问题可解释为树结构的似然函数,用于学习最优 Chow - Liu 树。
设 Chow - Liu 树有 $d$ 个节点,$X_1$ 为根变量,$(X_{m(2)}, \ldots, X_{m(d)})$ 是 $(X_2, \ldots, X_d)$ 的父变量。树 $T$ 上的分布可分解为:
$p_X(.|T) = p_{X_1} \prod_{j = 2}^{d} p_{X_j|X_{m(j)}}$
定义如下参数:
$\theta_j = p_{X_j|X_{m(j)}}(1|1)$,$j = 2, \ldots, d$
$\varphi_j = p_{X_j|X_{m(j)}}(1|0)$,$j = 2, \ldots, d$
$\theta_1 = p_{X_1}(1)$
考虑树网络中变量的 $t$ 个完整独立实例 $x_1, \ldots, x_t$,矩阵 $x$ 表示完整的独立实例集,$X$ 为随机矩阵。则有:
$p_X(x|T) =
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



