密集分割感知描述符:实现图像描述符的背景不变性
1. 引言
在计算机视觉领域,密集描述符正变得越来越受欢迎,广泛应用于密集图像对应、词袋图像分类和标签转移等任务。与传统的基于卷积操作的图像滤波器组不同,密集描述符采用局部描述符(如SIFT),更适合处理图像对应、分类和标注等任务。
早期的研究表明,用规则采样的SIFT描述符替代稀疏描述符用于图像分类具有显著优势。随后,一系列工作迅速确立了密集描述符在视觉任务中的多功能性、高效性和高性能。特别是SIFT - flow的开创性工作,通过用基于SIFT的相似度概念取代光流中的“亮度恒定”约束,推动了场景对应和标签转移等新应用的发展。
然而,使用密集描述符需要重新思考如何实现对干扰参数的不变性。在稀疏描述符技术中,通常先使用兴趣点检测器找到稳定的尺度和旋转不变点,然后在这些点周围的坐标系中提取描述符。但在密集设置中,由于大多数图像区域的尺度和方向难以可靠估计,这种策略并不可行。
近年来,一些工作致力于解决密集设置中的尺度和/或旋转不变性问题。例如,通过将全局图像配准技术应用于局部图像描述符,或者搜索不变子空间(如无尺度SIFT(SLS)描述符)。本文在此基础上,进一步追求对“背景变化”的不变性。
1.1 背景变化问题
在构建描述符时,围绕某一点的测量值可能来自不同的独立对象,这会导致在不同场景中同一特征点的描述符存在差异。例如,当对象的背景发生变化时,其边界附近的描述符会有所不同;或者由于场景的复杂几何结构导致自遮挡,也会使描述符在不同场景中产生差异。我们将这些情况统称为“背景可变性”。
目前,解决这个问题的工作相对较少。早期的工作中,Stein和Hebert引入了局
超级会员免费看
订阅专栏 解锁全文
3536

被折叠的 条评论
为什么被折叠?



