利用图割学习大间隔随机场
1. 随机场学习概述
许多计算机视觉任务,如分割和立体估计,都可以用随机场来建模。随机场描述了所有随机变量的联合概率分布,要么是联合分布,要么是在输入像素条件下的条件分布。这里主要在条件随机场(CRF)的背景下进行描述,不过这些算法也适用于一般的随机场。
1.1 随机场模型表示
用 ${z(n)}$ 表示输入实例的集合,对应的标签为 ${x(n)}$,其中 $n$ 为实例的索引。例如,一个实例可以是一张图像,$z$ 表示像素值向量,$x$ 表示其分割标签(前景或背景)。条件随机场的形式为:
[P (x | z, w) = \frac{1}{Z(z, w)}e^{-E(x,z;w)}]
其中,$w$ 是参数(权重),$Z$ 是归一化因子(配分函数)。典型的能量可以分解为节点 $V$(如单个像素)和边 $E$(如相邻像素对)的能量之和。考虑能量 $E$ 是参数 $w$ 以及节点和边特征 $\phi$ 和 $\psi$ 的线性函数,如:
[E(x, z; w) = \sum_{i\in V} w_1\phi_i(x_i, z) + \sum_{(i,j)\in E} w_2\psi_{ij}(x_i, x_j, z)]
可简写为 $E(x, z; w) = w^T \Phi(z, x)$,这是指数族中的对数线性模型。
1.2 随机场学习方法分类
应用这个模型包括两个主要步骤:一是从训练数据中学习模型的参数 $w$,二是使用学习到的参数推断测试数据的最可能标签。推断过程通常是一个能量最小化问题,很多时候可以通过图割来解决。参数学习的目标是找到适合训练数据且能推广到未见过的测试
超级会员免费看
订阅专栏 解锁全文
331

被折叠的 条评论
为什么被折叠?



