基于快速原始 - 对偶线性规划的 MAP 推理
1. 引言
离散马尔可夫随机场(MRF)优化在计算机视觉中无处不在,在诸如光流估计、图像分割、立体匹配和图像恢复(去噪)等各种问题中取得了巨大成功。在这些问题中,目标是最小化能量函数 $E(x) = \sum_{p\in V} \phi(x_p) + \sum_{pq\in E} \psi(x_p, x_q)$,其中每个 $x_p$ 从离散标签集 $L$ 中取值。
一元 MRF 势 $\phi(x_p)$ 编码数据似然,而二元势 $\psi(x_p, x_q)$ 作为正则化项,对获得高质量结果起着重要作用。在大多数情况下,二元势通常采用以下形式:$\psi(x_p, x_q) = w_{pq}d(x_p, x_q)$,其中 $w_{pq}$ 是每条边的权重,表示相邻对象 $p$ 和 $q$ 之间的关系强度,$d(x_p, x_q)$ 是测量标签之间差异的距离函数,这里假设 $d(\cdot, \cdot)$ 是半度量,即满足 $d(a, b) = 0 \Leftrightarrow a = b$ 且 $d(a, b) \geq 0$。
不同的距离函数选择会影响优化结果。例如,在立体匹配中,一元势可以定义为对应像素之间的强度/颜色差异,即 $\phi(x_p) = |I_{left}(p) - I_{right}(p + x_p)|^2$。权重 $w_{pq}$ 可以根据视差不连续性通常与图像域中的边缘重合这一事实来定义。对于距离函数 $d(\cdot, \cdot)$,选择标签的平方欧几里得距离 $d(x_p, x_q) = |x_p - x_q|^2$ 会过度惩罚视差跳跃,导致过度平滑,因此使用如 $d(x_p, x_q) = \
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



