基于相位相关引导搜索的实时立体视觉算法
1. 引言
在3D立体视觉中,视差估计是一项基础任务,其目标是确定相机阵列到场景中每个物体的距离。视差被定义为参考图像中给定像素与匹配图像中对应像素的位置差异。为了获取每个像素的视差,需要找到两幅图像之间的像素对应关系,但这是一个严重的不适定问题,原因如下:
- 遮挡问题 :某些区域可能只对一个相机可见,而被其他物体遮挡,导致另一个相机无法看到。
- 均匀区域和周期性纹理 :在这些区域中,一个像素可能与该区域内的许多其他像素匹配,造成匹配的不确定性。
- 噪声干扰 :噪声会在图像之间产生人为差异,影响匹配的准确性。
目前,最先进的立体视觉技术旨在对噪声具有鲁棒性,并为匹配过程失败的区域提供视差值,通常通过引入正则化约束来实现视差图的(分段)平滑。此外,当参考图像和匹配图像充分对齐时,极线是完全水平的,对应点总是在同一行,这一假设可以显著减少搜索空间。
解决对应问题的算法主要分为全局优化方法和局部优化方法:
- 全局方法 :通常试图找到使全局能量函数最小化的视差场,该能量函数包括一个衡量不匹配数量和程度的项,以及一个通过惩罚视差突变来强制空间一致性的项。常用的方法有马尔可夫随机场、隐马尔可夫测度场和信念传播等。
- 局部方法 :通常不如全局方法准确,它会在参考图像中选取一个像素或区域,并在匹配图像的极线上进行搜索,以找到使局部误差度量最小化或使两个区域之间的相关度量最大化的像素或区域。常见的方法是估计以一个
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



