摘要:许多计算机视觉问题可以被表述为标签问题。期望的解决方案通常是空间平滑的标记,其中标签过渡与输入图像的颜色边缘对齐。本文表明,通过使用非常快速的边缘保留滤波器平滑标签成本,可以有效地实现这样的解决方案。在本文中提出了一个常规和简单的框架包含三个步骤:1、构建匹配代价,2、快速代价过滤,3、赢者通吃标签选择。本文的主要贡献是在一个简单的框架中,可以为多个计算机视觉应用实现最新最好的效果。尤其在本文中将提到如下工作的完成,1、实时产生视差图,其质量超过Middlebury基准中的所有其他快速(本地)方法。2、光流场具有非常精细的结构以及大的位移。为证明鲁棒性,在不同的应用中在少数几个参数设置几乎相同的值。并且提出了交互式图像分割的结果。
1、概述
离散的基于标签的方法已经成功地用于解决计算机视觉问题,比如立体视觉,光流场,交互的图像分割或者目标识别。在典型的标记方法中,输入数据用于构建三维匹配代价,其存储的匹配代价用来在图像坐标x,y处选择标签。对于立体匹配,这些匹配代价由相应像素之间的像素相关性给出。(例,强度的绝对差异)
要解决此类问题的方法是1、服从标签匹配代价。2、空间平滑。3、在图像边缘更改标签。一种常用的方法是利用马尔可夫随机场模型(CRF)。这意味着制定能量函数,其中标签的匹配代价在数据项中编码,边缘的平滑由其中成对的平滑解决。这个代价函数可以使用全局函数的最小化实现。缺点是这种全局方法通常相对较慢并且不能很好地扩展到高分辨率图像或大标签空间。由于全局优化模式较少,快速近似通常会以质量损失为代价。
离散标记方法的连续对应物基于凸能量函数,其可以在GPU上有效地优化。缺点是许多这些方法具有受限形式的数据和平滑项。例如,光流中的亮度恒定性假设通常是线性化的,因此仅对小位移有效。为了解决这些问题,通常使用coarse-to-fine框架但是仍然不能处理比其运动小得多的对象。另一个问题是光滑度项的凸性造成的,这可能使解决方案过于平滑。
基于能量的方法比较好的替代方法是应用局部滤波方法。局部滤波的应用可以达到在标签上的局部空间起到平滑的效果,与CRF在全局空间的平滑相反。局部平滑能够取得更好的结果,主要原因是数据项在平

本文介绍了一种基于引导滤波器的快速、高效框架,用于解决计算机视觉中的多标签问题,如立体匹配、光流场和图像分割。通过在匹配代价上应用引导滤波器,实现了在保持边缘细节的同时,对标签进行空间平滑,从而提高了算法的精度和速度。
最低0.47元/天 解锁文章
2763

被折叠的 条评论
为什么被折叠?



