实时立体视觉与无损真彩色图像压缩技术解析
1. 实时立体视觉中的相位相关引导搜索
1.1 不同场景下的计算时间测量
在立体视觉研究中,对不同场景下的视差图计算时间进行了测量。以图像尺寸为 256 × 192 为例,针对维纳斯场景和筑波场景进行了测试。在维纳斯场景中,由于场景中的物体形成倾斜平面,视差平滑变化,仅使用 16 个值无法正确估计视差。
对于筑波场景,使用了 256 × 192 的子采样版本图像,以应用更高效的算法。测试了不同相关窗口大小和正则化类型下的计算时间,结果如下表所示:
|相关窗口大小|全搜索|POC 搜索|POC 滤波|POC + 中值滤波|
| ---- | ---- | ---- | ---- | ---- |
|5 × 5|14 ms|5 ms|6 ms|8 ms|
|11 × 11|17 ms|6.5 ms|7 ms|9 ms|
|19 × 19|22 ms|7.5 ms|8 ms|10 ms|
从表中可以看出,POC 搜索方法在计算时间上明显优于全搜索方法,且随着相关窗口的增大,这种优势依然存在。
1.2 视频序列测试结果
还使用了一些真实视频序列对算法进行测试,如迪·斯特凡诺等人在 2004 年论文中使用的“室内”和“室外”序列。以“室外”序列的第 0050 帧为例,对比了迪·斯特凡诺的 SMP 方法和本文算法得到的视差图。由于这些序列的真实视差未知,只能从定性角度进行质量评估。两种算法表现相似,都能区分场景中的主要物体及其与相机的相对距离,但在均匀区域(如木板、人的肩膀)和遮挡区域(如物体边界)存在明显的不匹配。
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



