利用高阶势强制执行标签一致性
在计算机视觉领域,解决图像标注问题,如对象分割、立体视觉和单视图重建,一直是一个具有挑战性的任务。传统的方法在处理复杂场景和精确提取对象边界时存在一定的局限性。本文将介绍一种基于高阶条件随机场(CRF)模型的方法,该方法通过引入高阶势来强制执行图像区域的标签一致性,从而显著提高对象分割的效果。
1. 引言
近年来,使用无监督分割算法得到的图像段(即超像素)来解决各种图像标注问题越来越流行。这种方法的灵感来源于观察到构成特定段的像素通常具有相同的标签,例如它们可能属于同一个对象或具有相同的表面方向。
使用超像素的方法有以下优点:
- 可计算高阶特征 :可以基于构成段的所有像素计算高阶特征,并用于分类。
- 提高计算效率 :推理只需在少量超像素上进行,而不是图像中的所有像素,因此速度更快。
然而,基于分组段的方法假设段与图像中的对象边界一致,即段不包含多个对象。但实际上,无监督分割方法得到的段往往是错误的。为了克服这些问题,一些方法使用图像的多个分割结果,希望尽管大多数分割结果不好,但有些是正确的,从而对任务有用。不过,这些方法使用的启发式算法缺乏最优性保证,可能会产生不好的结果。
本文介绍的算法可以以一种有原则的方式计算标注问题的解,该方法使用高阶CRF,将定义在像素集上的势函数与传统的一元和二元线索相结合。实验表明,高阶模型的结果明显优于使用二元CRF模型的结果。
1.1 对象分割与识别
对象分割和识别的结合是计算机视觉中最具挑战性和基础性的问题之一。近年来,出现了一些将对
超级会员免费看
订阅专栏 解锁全文
3万+

被折叠的 条评论
为什么被折叠?



