立体匹配:基础、前沿技术与现存挑战
1. 引言
立体匹配是计算机视觉中至关重要的任务之一,因其广泛的应用领域吸引了众多研究者的关注。它的应用场景包括自动驾驶、无人机、道路状况评估、移动机器人导航以及遥感等。随着立体匹配算法的快速发展,研究人员也在努力创建公共基准和数据集,以便评估自己算法的有效性。借助机器学习技术的进步,立体匹配算法在公共基准上已能达到极高的精度。然而,仍有诸多挑战尚未解决,例如遮挡区域的视差估计和无监督训练等问题,这些挑战阻碍了更精确的视差估计和更广泛的应用。
2. 单相机模型
2.1 透视相机模型
透视相机模型通过相机中心将世界中的观测点投影到成像平面。如图所示,$o^{C}$ 表示相机中心,$\Pi$ 和 $\hat{\Pi}$ 分别代表成像平面和归一化成像平面,$f$ 为相机焦距。光轴是从 $o^{C}$ 出发并垂直穿过 $\Pi$ 的射线。在相机坐标系(CCS)中,一个观测的三维点 $p^{C} = [x^{C}, y^{C}, z^{C}]^{T}$ 被投影到 $\Pi$ 上的 $\bar{p} = [x, y, f]^{T}$。它们之间的几何关系为:
[
\frac{x^{C}}{x} = \frac{y^{C}}{y} = \frac{z^{C}}{f}
]
$p^{C}$ 在 $\hat{\Pi}$ 上的归一化坐标为 $\hat{p}^{C} = [\frac{x^{C}}{z^{C}}, \frac{y^{C}}{z^{C}}, 1]^{T}$,上述关系可改写为:
[
\bar{p} = f\hat{p}^{C} = \frac{f}{z^{C}}p^{C}
超级会员免费看
订阅专栏 解锁全文
66

被折叠的 条评论
为什么被折叠?



