相机内外参矩阵/Mono2Depth相机转换矩阵，位姿矩阵

初岘

已于 2024-08-14 17:10:55 修改

阅读量1.5k

点赞数 17

文章标签：矩阵线性代数机器人

于 2024-08-07 21:14:44 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_67051070/article/details/141001340

版权

Mono2Depth_Mat转换矩阵，代表了mono和depth的相对关系，depth有深度信息，3d空间；mono是2d图像，通过转换矩阵可以将3d空间投影到2d空间，也就是图像中的物体有了深度信息。

物体在空间中的姿态可以理解为坐标+方向，一个向量（6个数），那么一个四维的转换矩阵参数是够用的。

位姿矩阵 (Pose Matrix):

位姿矩阵描述了一个物体在3D空间中的位置和方向。它通常是一个4x4的矩阵,包含了旋转和平移信息。

结构:

[R R R Tx]
[R R R Ty]
[R R R Tz]
[0 0 0  1]

其中:

R 是一个3x3的旋转矩阵
[Tx, Ty, Tz] 是平移向量

位姿矩阵可以将一个点从物体的局部坐标系转换到世界坐标系。

2.转换矩阵 (Transformation Matrix):

转换矩阵是一个更广泛的概念,它可以表示各种线性变换,包括但不限于:

平移
旋转
缩放
错切

对于3D空间中的点,转换矩阵通常也是4x4的。

一般形式:

[a b c d]
[e f g h]
[i j k l]
[m n o p]

特殊情况:

当表示纯旋转和平移时,转换矩阵与位姿矩阵形式相同。
当包含缩放时,旋转部分的矩阵不再是正交的。

3.位姿矩阵 vs 转换矩阵:

所有的位姿矩阵都是转换矩阵,但并非所有转换矩阵都是位姿矩阵。
位姿矩阵专门用于描述刚体变换(旋转+平移),而转换矩阵可以描述更广泛的线性变换。
位姿矩阵的旋转部分(3x3)是正交矩阵,而一般的转换矩阵则不一定。

4.使用:

位姿矩阵常用于描述相机或物体在世界中的位置和方向。
转换矩阵在计算机图形学中广泛使用,可以实现各种几何变换。

5.重要性质:

位姿矩阵的逆矩阵表示相反的变换。
多个位姿矩阵或转换矩阵可以通过矩阵乘法组合,得到复合变换。

内参矩阵（Intrinsic Matrix）：

内参矩阵描述的是相机的内部光学特性，它将相机坐标系中的3D点转换为图像平面上的2D点。

import numpy as np

# 相机内参矩阵
fx = 500  # x方向焦距
fy = 500  # y方向焦距
cx = 320  # 主点x坐标
cy = 240  # 主点y坐标

K = np.array([
    [fx, 0,  cx],
    [0,  fy, cy],
    [0,  0,  1 ]
])

print("相机内参矩阵:")
print(K)

# 相机坐标系中的3D点
X, Y, Z = 1, 2, 5

# 投影到图像平面
x = X / Z
y = Y / Z
pixel_coords = K @ np.array([x, y, 1])

# 归一化坐标
u, v = pixel_coords[:2] / pixel_coords[2]

print(f"\n相机坐标系中的3D点 ({X}, {Y}, {Z}) 投影到图像坐标: ({u}, {v})")

内参矩阵包含：

焦距（fx, fy）：描述了相机的放大倍数
主点坐标（cx, cy）：通常接近图像中心，代表光轴与图像平面的交点

外参矩阵（Extrinsic Matrix）：

外参矩阵描述了相机在世界坐标系中的位置和方向。它由旋转矩阵R和平移向量t组成，通常表示为：

import numpy as np

# 旋转矩阵（这里假设相机没有旋转）
R = np.eye(3)

# 平移向量（假设相机在世界坐标系原点向x轴平移了100单位）
t = np.array([100, 0, 0])

# 构建4x4的外参矩阵
extrinsic_matrix = np.eye(4)
extrinsic_matrix[:3, :3] = R
extrinsic_matrix[:3, 3] = t

print("相机外参矩阵:")
print(extrinsic_matrix)

# 世界坐标系中的点
world_point = np.array([10, 20, 30, 1])

# 转换到相机坐标系
camera_point = extrinsic_matrix @ world_point

print(f"\n世界坐标系中的点 {world_point[:3]} 转换到相机坐标系: {camera_point[:3]}")

外参矩阵用于将世界坐标系中的点转换到相机坐标系。

Mono2Depth_Mat的本质：

现在回到您的问题，Mono2Depth_Mat实际上是一个外参矩阵。它描述了单目相机（Mono）相对于深度相机（Depth）的位置和方向。

在代码中：

Mono2Depth_Mat << 0.00410335, 0.999976, 0.00550878, -0.00025098,
    -0.910026, 0.00145053, 0.414548, -0.0455342,
    0.41453, -0.00671417, 0.910011, 0.0103787,
    0, 0, 0, 1;

这个矩阵的结构是：

左上3x3部分是旋转矩阵R
右上3x1部分是平移向量t
最后一行[0, 0, 0, 1]使其成为一个齐次变换矩阵

Mono2Depth_Mat用于将深度相机坐标系中的点转换到单目相机坐标系。这是必要的，因为两个相机可能有微小的位置和方向差异。

综合应用：

在代码中，全局变换矩阵的计算：

All_Mat = MONO_Mat * Mono2Depth_Mat * DEPTH_Mat.inverse();

这个计算综合了：

DEPTH_Mat.inverse()：将深度图像坐标转换为深度相机3D坐标
Mono2Depth_Mat：将深度相机3D坐标转换为单目相机3D坐标
MONO_Mat：将单目相机3D坐标投影到单目图像平面

这样，All_Mat就能直接将深度图像的点映射到单目图像上，实现了深度图到彩色图的对齐。

总结：

内参矩阵描述相机的光学特性，用于3D到2D的投影
外参矩阵描述相机在空间中的位置和方向，用于坐标系转换
Mono2Depth_Mat是一个外参矩阵，描述了两个相机之间的空间关系

详细解释一下内参矩阵和外参矩阵的特性以及它们的计算方法。

内参矩阵（Intrinsic Matrix）

特性：

通常是固定的，对于特定相机来说是唯一的。
描述相机的内部光学特性。
在相机不改变焦距（如使用定焦镜头）的情况下保持不变。

计算方法：内参矩阵通常通过相机标定（Camera Calibration）过程获得。标定过程如下：

import c

最低0.47元/天解锁文章