计算机视觉中的投影几何与变换
1. 引言
在计算机视觉领域,坐标系统是描述角度和长度的便捷工具,通过矩阵代数可以简单地实现坐标的平移、旋转和缩放变换。然而,投影所定义的关系却难以用同样简单的代数方法来描述。为了解决这一问题,投影几何应运而生,它采用齐次坐标系统来替代笛卡尔坐标系统,为处理投影关系提供了更有效的方式。
2. 齐次坐标与投影几何
投影几何在代数上由齐次坐标系统来表示,这种表示方式自然地描述了相机坐标与真实世界坐标之间的关系,也就是图像空间与物理空间的关系。其主要优势在于,诸如旋转、缩放和投影等图像变换都可以通过矩阵乘法来实现。投影能够提供与物体距离相关的透视效果,从而影响物体在图像中的大小。
2.1 坐标映射
- 二维笛卡尔坐标点 ( x_c = [x, y]^T ) 可以映射到齐次坐标点 ( x_h = [wx, wy, w]^T ),其中 ( w ) 是任意标量。一个笛卡尔坐标点可以映射到多个齐次坐标点,因此齐次坐标也被称为冗余坐标。
- 从齐次坐标到笛卡尔坐标的映射可以通过 ( x_c = \frac{wx}{w} ) 和 ( y_c = \frac{wy}{w} ) 实现。
- 齐次表示可以扩展到任意维度,例如三维笛卡尔坐标点 ( x_c = [x, y, z]^T ) 映射到齐次形式为 ( x_h = [wx, wy, wz, w]^T ),再通过 ( x_c = \frac{wx}{w} ),( y_c = \frac{wy}{w} ) 和 ( z_c = \frac{wz}{w} ) 映射回笛卡尔坐标。
超级会员免费看
订阅专栏 解锁全文
46

被折叠的 条评论
为什么被折叠?



