马尔可夫随机场能量最小化方法的比较研究
1. 引言
近年来,能量最小化方法迎来了复兴,这主要得益于图割(graph cut)和循环置信传播(LBP)等强大的新优化算法。这些方法在立体视觉等领域取得了显著成果,根据广泛使用的Middlebury立体视觉基准测试,几乎所有表现优异的立体视觉方法都依赖于图割或LBP,并且能提供比以往更精确的结果。同时,像素标记问题的应用范围也大幅扩展,涵盖图像恢复、纹理建模、图像标记、立体匹配、交互式照片分割和数字图像拼接等领域。
然而,人们对各种优化算法的相对性能关注较少。已有一些研究对不同算法进行了比较,例如比较图割中不同最大流算法的效率,以及在4连接网格图上比较图割和LBP在立体视觉中的应用。此外,还有研究考虑了具有更复杂图拓扑结构的模型,如带遮挡的立体视觉问题,以及具有不同性质的马尔可夫随机场应用。
2. 问题表述与实验基础
2.1 能量模型
将像素标记问题定义为为每个像素 $i$ 分配一个标签 $l_i$,所有像素标签分配的集合记为 $l$,像素数量为 $N$,标签数量为 $K$。能量函数 $E$ 由数据能量 $U$ 和平滑能量 $V$ 组成,即 $E = U + \lambda V$。数据能量 $U$ 是每个像素数据成本 $\phi_i(l_i)$ 的总和,通常来自测量噪声的负对数似然。
假设像素形成二维网格,使用标准的4连接邻域系统,平滑能量 $V$ 是空间变化的水平和垂直最近邻平滑成本的总和。平滑成本有一般形式和更受限的形式,受限形式为 $V = \sum_{ {i,j} \in N} w_{ij} \cdot \psi(|l_i - l_j|)$,其
超级会员免费看
订阅专栏 解锁全文
7783

被折叠的 条评论
为什么被折叠?



