3D 几何与立体视觉入门
在计算机视觉领域,利用单相机和多相机进行 3D 几何和立体视觉处理是一项重要的技术。通过掌握相关的几何知识,我们能够将图像坐标转换为实际的 3D 世界坐标,从而建立起图像位置与现实世界物理位置之间的联系。本文将详细介绍单相机校准和立体视觉的相关内容。
单相机校准
在计算机视觉中,传感器校准是一项基础且关键的工作。相机作为一种传感器,同样需要进行校准,以提供具有实际物理单位的信息。如果不进行校准,我们只能获取物体在图像中的坐标,这对于需要与现实世界进行交互的机器人视觉系统来说,其作用是非常有限的。
相机数学模型
为了更好地理解相机校准的原理,我们首先需要了解相机的数学模型。在这个模型中,来自真实世界物体的光线通过镜头系统聚焦在相机的投影中心。我们以投影中心为原点建立一个 3D 坐标系,这被称为相机坐标系。相机的成像平面位于 Z 轴上距离投影中心为焦距 f 的位置,成像平面有其自身的 2D 坐标系 (u, v),我们暂时将其原点设定在相机 Z 轴与成像平面的交点 (u0, v0) 处。
通过相似三角形的原理,我们可以得到物体在相机坐标系中的 (X, Y, Z) 坐标与它在成像平面上的 (u, v) 坐标之间的关系:
[
\begin{cases}
u_p = \frac{fX}{Z}\
v_p = \frac{fY}{Z}
\end{cases}
]
然而,在大多数成像软件中,图像的原点通常位于左上角。考虑到这一点,上述关系会变为:
[
\begin{cases}
u_p - u_0 = \frac{fX}