视觉slam14讲读书笔记(3)--三维空间刚体运动

本文深入讲解三维空间中的变换原理,包括旋转矩阵、欧拉角、四元数的概念及其相互转换方法,并探讨它们在坐标变换中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 旋转矩阵

一个刚体在三维空间中的运动由一次旋转加一次平移组成。本文主要介绍旋转矩阵、欧拉角、四元数的意义,以及他们是如何运算和转化的。

1.1 点和向量、坐标系

在三维空间中,刚体不仅有位置还有姿态。比如相机,我们可以说相机位于世界坐标系的(000)处(位置),朝向正前方(姿态)。

向量(也称为欧几里得向量、几何向量、矢量),指具有大小和方向的量。三维空间中某个向量的坐标可以用 R3 R 3 中的3个数来描述。如果确定了坐标系,也就是线性空间的基 (e1,e2,e3) ( e 1 , e 2 , e 3 ) ,那么向量 a⃗  a → 在这组基下的坐标可以表示为:

a⃗ =[e1,e2,e3]a1a2a3=a1e1+a2e2+a3e3.(3.1) (3.1) a → = [ e 1 , e 2 , e 3 ] [ a 1 a 2 a 3 ] = a 1 ⋅ e 1 + a 2 ⋅ e 2 + a 3 ⋅ e 3 .

对于 a⃗ b⃗ R3 a → , b → ∈ R 3 ,向量的 内积可以表示为:
a⃗ b⃗ =a⃗ Tb⃗ =i=13aibi=|a||b|cos<a,b>.(3.2) (3.2) a → ⋅ b → = a → T ⋅ b → = ∑ i = 1 3 a i ⋅ b i = | a | ⋅ | b | ⋅ cos < a , b > .

内积可以表示向量间的投影关系。
向量的 外积表示为:
a⃗ ×b⃗ =ia1b1ja2b2ka3b3=a2b3a3b2a3b1a1b3a1b2a2b1=0a3a2a30a1a2a10b⃗ =a⃗ sb⃗ .(3.3) (3.3) a → × b → = | | i j k a 1 a 2 a 3 b 1 b 2 b 3 | | = [ a 2 ⋅ b 3 − a 3 ⋅ b 2 a 3 ⋅ b 1 − a 1 ⋅ b 3 a 1 ⋅ b 2 − a 2 ⋅ b 1 ] = [ 0 − a 3 a 2 a 3 0 − a 1 − a 2 a 1 0 ] ⋅ b → = a → s ⋅ b → .

外积的方向垂直于上面两个向量,大小为 |a⃗ ||b⃗ |sin<a,b> | a → | ⋅ | b → | ⋅ sin < a , b > 。对于外积,本文引入了 a⃗ s a → s 来表示基于 a⃗  a → 反对称矩阵。外积只对三维向量存在定义,此外还能使用外积来表示旋转。
反对称矩阵的定义:设 A A n阶方阵,若有 AT=A A T = − A ,则称方阵 A A 为反对称矩阵。

1.2 坐标系间的欧式变换

我们以旋转加平移来描述两个坐标系之间的变换关系。在刚体的运动过程中,常见的做法是设定一个世界坐标系(或者叫惯性坐标系),可以认为它是固定不动的。同时,刚体则是一个移动坐标系。
刚体运动保证了同一个向量在各个坐标系下的长度和夹角都不会发生变化。其在各个坐标系之间的变换称为欧式变换。欧式变换由一个旋转加一个平移组成。
首先考虑旋转。设某个单位正交基(e1,e2,e3)经过一次旋转变成了 (e1,e2,e3) ( e 1 ′ , e 2 ′ , e 3 ′ ) 。那么对于同一个向量 a⃗  a → (该向量并没有随着坐标系的旋转而发生运动),它在两个坐标系下的坐标为 [a1,a2,a3]T [ a 1 , a 2 , a 3 ] T [a1,a2,a3]T [ a 1 ′ , a 2 ′ , a 3 ′ ] T 。根据坐标的定义有:

[e1,e2,e3]a1a2a3=(e1,e2,e3)a1a2a3.(3.4) (3.4) [ e 1 , e 2 , e 3 ] [ a 1 a 2 a 3 ] = ( e 1 ′ , e 2 ′ , e 3 ′ ) [ a 1 ′ a 2 ′ a 3 ′ ] .

对上述 3.4 3.4 式左右两边同时左乘 e1e2e3 [ e 1 e 2 e 3 ] ,可得:
a1a2a3=eT1e1eT2e1eT3e1eT1e2eT2e2eT3e2eT1e3eT2e3eT3e3a1a2a3=Ra⃗ .(3.5) (3.5) [ a 1 a 2 a 3 ] = [ e 1 T ⋅ e 1 ′ e 1 T ⋅ e 2 ′ e 1 T ⋅ e 3 ′ e 2 T ⋅ e 1 ′ e 2 T ⋅ e 2 ′ e 2 T ⋅ e 3 ′ e 3 T ⋅ e 1 ′ e 3 T ⋅ e 2 ′ e 3 T ⋅ e 3 ′ ] [ a 1 ′ a 2 ′ a 3 ′ ] = R ⋅ a → ′ .

由式 3.5 3.5 可知 R R 描述了旋转关系,因此被称为旋转矩阵。事实上,R 是一个行列式为1的 正交矩阵(逆为其自身转置的矩阵),反之,行列式为1的正交矩阵也是一个旋转矩阵。综上,旋转矩阵的集合定义如下:
SO(n)={RRnn|RRT=I,det(R)=1}.(3.6) (3.6) S O ( n ) = { R ∈ R n ∗ n | R R T = I , d e t ( R ) = 1 } .

SO(n) S O ( n ) 是特殊正交群(Special Orthogonal Group)的意思。特别地, SO(3) S O ( 3 ) 就是三维空间的旋转了。也就是,旋转矩阵可以描述刚体的旋转。
由于旋转矩阵是正交矩阵,它的逆描述了一个相反的旋转。因此可得:
a⃗ =R1a⃗ =RTa⃗ (3.7) (3.7) a → ′ = R − 1 a → = R T a →

显然 RT R T 是一个相反的旋转。
对于欧式变换来说,除了旋转外一般还有平移。我们使用平移向量 t t 来表示平移,则一个完整的欧式空间的坐标变换如下:
(3.8)a=a=Ra+t.

1.3 变换矩阵与齐次坐标

3.8 3.8 完整的表达了欧式空间的旋转与平移,但是该变换并不是一个线性变换。假如我们进行了两次变换: R1,t1 R 1 , t 1 R2,t2 R 2 , t 2 ,满足:

b⃗ =R1a⃗ +t1,c⃗ =R2b⃗ +t2. b → = R 1 ⋅ a → + t 1 → , c → = R 2 ⋅ b → + t 2 → .

a a c的变换为:
c⃗ =R2(R1a⃗ +t1)+t2. c → = R 2 ( R 1 ⋅ a → + t 1 → ) + t 2 → .

在经过多次变换后上式会显得非常复杂。因此,本文引入齐次坐标和变换矩阵重写式 (3.8) ( 3.8 )
[a1]=[R0Tt⃗ 1][a⃗ 1]=T[a⃗ 1].(3.9) (3.9) [ a ′ → 1 ] = [ R t → 0 T 1 ] [ a → 1 ] = T [ a → 1 ] .

如式 (3.9) ( 3.9 ) 所示,我们在每一个三维向量的末尾添加1,将其变为四维向量,称为 齐次坐标。其中矩阵 T T 称为变换矩阵(Transform Matrix),变换矩阵左上角为旋转矩阵,右侧为平移向量,左下角为0向量,右下角为1。我们暂时用 a¯¯¯⃗  a ¯ → 表示 a⃗  a → 的齐次坐标。由齐次坐标和变换矩阵可得:
b¯¯⃗ =T1a¯¯¯⃗ ,c¯¯⃗ =T2b¯¯⃗ =T2T1a¯¯¯⃗ .(3.10) (3.10) b ¯ → = T 1 ⋅ a ¯ → , c ¯ → = T 2 ⋅ b ¯ → = T 2 ⋅ T 1 ⋅ a ¯ → .

此外由式 (3.9) ( 3.9 ) 表示的变换矩阵 T T 又称为特殊欧式群(Special Euclidean Group)
(3.11)SE(3)={T=[Rt0T1]R44|RSO(3),tR3}.

2. 旋转向量和欧拉角

SO(3) S O ( 3 ) 的旋转矩阵有9个量,但是一次旋转只有3个自由度。同样,变换矩阵用16个量来表示6个自由度(旋转加平移)的变换。因此这种方式是冗余的。此外旋转矩阵和变换矩阵都带了其他一些额外约束。

2.1 旋转向量

对于坐标系的旋转,可以用一个旋转轴和一个旋转角来刻画。于是,我们使用一个向量,其方向旋转轴一致,而长度等于旋转角。这样的向量称为旋转向量(或轴角)。
对于变换矩阵,我们使用一个旋转向量和一个平移向量即可表达一次变换。假设有一个旋转轴为 n n ,角度为θ的旋转,那么它对应的旋转向量为 θn θ n
从旋转向量到旋转矩阵的转换过程由罗德里格斯公式表明,如下为转换结果:

R=cosθI⃗ +(1cosθ)nnT+sinθns(3.12) (3.12) R = cos ⁡ θ ⋅ I → + ( 1 − cos ⁡ θ ) ⋅ n n T + sin ⁡ θ ⋅ n s

符号 s s 是向量到反对称的转换符。
对于转角θ,有:
θ=arccos(tr(R)1/2)(3.13) (3.13) θ = arccos ⁡ ( t r ( R ) − 1 / 2 )

关于转轴 n n ,由于旋转轴上的向量在旋转后不发生改变,有以下:
(3.14)Rn=n

由此可见,转轴 n n 是矩阵R特征值为1对顶的特征向量。

2.2 欧拉角

欧拉角提供了一种直观的方式来描述旋转,它使用3个分离的转角,把一个旋转分解成3次绕不同的轴的旋转。欧拉角当中比较常用的一种便是用“偏航-俯仰-滚转(yaw-pitch-roll)”3个角度来描述一个旋转的,该旋转等价于ZYX轴的旋转。ZYX转角相当于把任意旋转分解成以下3个轴上的轴角:
1. 绕物体的Z轴旋转,得到偏航角yaw;
2. 绕旋转之后的Y轴旋转,得到俯仰角pitch;
3. 绕旋转之后的X轴旋转,得到滚转角roll;
欧拉角的一个重大确定是会碰到著名的万向锁问题:当俯仰角为 ±90 ± 90 。 时,第一次旋转与第三次旋转将使用同一个轴,这会导致系统丢失一个自由度。

2.3 四元数

关于四元数的定义以及运算可参考如下两篇博客:
1. 中文版 https://www.qiujiawei.com/understanding-quaternions/
2. 英文版 https://www.3dgep.com/understanding-quaternions/

2.3.1 用四元数表示旋转

我们可以用四元数表达对一个点的旋转。假设一个空间三维点 p=[x,y,z]R3 p = [ x , y , z ] ∈ R 3 ,以及一个轴角 n,θ n , θ 指定的旋转。三维点 p p 经过旋转之后变为p。使用四元数来描述这个旋转。首先,将三维空间点用一个虚四元数来表示:

p=[0,x,y,z]=[0,v]. p = [ 0 , x , y , z ] = [ 0 , v ] .

然后用四元数 q q 来表示这个旋转:
q=[cosθ2,nsinθ2]

那么,旋转后的 p p ′ 即可表示为如下式:
p=qpq1(3.15) (3.15) p ′ = q p q − 1

可以验证。式 (3.15) ( 3.15 ) 计算得出的结果为 0 0 ,故为纯虚四元数。其虚部的3个分量表示旋转后3D点的坐标。

2.3.2 四元数到旋转矩阵的转换

设四元数q=q0+q1i+q2j+q3k,则对应的旋转矩阵 R R

(3.16)R=[12q222q322q1q22q0q32q1q3+2q0q22q1q2+2q0q312q122q322q2q32q0q12q1q32q0q22q2q3+2q0q112q122q22]

反之,由旋转矩阵到四元数的转换如下。假设矩阵 R=mij,i,j[1,2,3] R = m i j , i , j ∈ [ 1 , 2 , 3 ] ,其对应的四元数 q q 由下式给出:
(3.17)q0=tr(R)+12,q1=m23m324q0,q2=m31m134q0,q3=m12m214q0

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值