《Real-Time Rendering》第四版学习笔记——Chapter 4 Transforms（一）

董小虫

已于 2022-02-22 19:38:01 修改

阅读量820

点赞数

分类专栏： Real-Time Rendering学习笔记文章标签：《RTR》学习实时渲染

于 2022-02-04 14:47:48 首次发布

本文链接：https://blog.youkuaiyun.com/dongzhong1990/article/details/122781502

版权

Real-Time Rendering学习笔记专栏收录该内容

11 篇文章

订阅专栏

本文详细介绍了实时渲染中的变换，包括基础变换如平移、旋转、缩放、切变及其串联，深入探讨了欧拉变换、矩阵分解，以及四元数的数学背景和在变换中的应用，如四元数旋转、球面线性插值等，是理解3D图形变换的重要参考。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

引言

线性变换：保持向量加法和缩放操作：
$\mathbf f(\mathbf x)+\mathbf f(\mathbf y)=\mathbf{f}(\mathbf x+\mathbf y),\\ k\mathbf f(\mathbf x)=\mathbf f(k\mathbf x)$

旋转和缩放变换都是对三维向量的线性变换，可以表示为 $3\times3$ 矩阵。

平移变换是对一个向量执行加上另一个向量的操作； $3\times3$ 矩阵无法满足移动变换的表示。

仿射变换（affine transform）通过 $4\times4$ 矩阵将平移变换与旋转、缩放变换结合起来。使用齐次（homogeneous）标记来表示思维向量：

方向向量： $\mathbf v=(v_x\quad v_y\quad v_z\quad 0)^T$ ；
点： $\mathbf v=(v_x\quad v_y\quad v_z\quad 1)^T$ ；

平移、旋转、缩放、反射、切变矩阵都是放射矩阵。仿射矩阵点特点就是保持线的平行性，但不保持长度和角度。仿射变换也可以表示为任意单独的仿射变换的串联。

一、基础变换

下表是大部分基础变换的汇总：

$\begin{array}{c|c|c} \textbf{标记} & \textbf{名称} & \textbf{特点} \\ \hline \mathbf T(\mathbf t) & 平移矩阵 & 移动一个点，仿射 \\ \mathbf R_x(\rho) & 旋转矩阵 & 围绕x轴旋转\rho弧度。正交、仿射 \\ \mathbf S(\mathbf s) & 缩放矩阵 & 根据\mathbf s 沿着个坐标轴缩放。仿射 \\ \mathbf H_{ij}(s) & 切变矩阵 & 将i 分量进行为s倍数的依据j分量的切变操作。仿射 \\ \mathbf E(h,p,r) & 欧拉变换 & 以欧拉角形式表示的指向矩阵。正交、仿射\\ \mathbf P_o(s) & 正交投影 & 向平面或空间内进行平行投影。仿射\\ \mathbf P_p(s) & 透视投影 & 向平面或空间内进行符合透视规则的投影\\ \mathrm{slerp}(\mathbf{\hat q},\mathbf{\hat r},t) & 球面线性插值 & 根据四元数\mathbf{\hat q}和\mathbf{\hat r}以及参数t来创建插值的四元数 \end{array}$

1.1 平移

将一个实体沿着向量 $\mathbf v=(t_x,t_y,t_z)$ 平移的变换矩阵可以表示为：
$\mathbf T(\mathbf t) = \mathbf T(t_x,t_y,t_z) = \begin{pmatrix}1 & 0 & 0 & t_x\\ 0 & 1 & 0 & t_y\\ 0 & 0 & 1 & t_z\\ 0 & 0 & 0 & 1 \end{pmatrix}$
需要注意的是，平移变换对向量 $\mathbf v=(v_x,v_y,v_z,0)$ 不生效；也就是说，方向向量是不能被平移的。

平移矩阵的逆矩阵为： $\mathbf T^{-1}(\mathbf t)=\mathbf T(-\mathbf t)$ 。

1.2 旋转

旋转变换指的是将一个向量（位置或方向）以给定坐标轴为中心旋转特定角度。和平移变换一样，旋转变换也是刚体变换并且保持手性。

二维情况下的推导：假设一个向量 $\mathbf v=(v_x, v_y)=(r\cos(\theta), r\sin(\theta))$ ，对其逆时针旋转 $\phi$ 弧度，得到 $\mathbf u=(r\cos(\theta+\phi),r\sin(\theta+\phi))$ ：
$\mathbf u=\begin{pmatrix}r\cos(\theta+\phi)\\r\sin(\theta+\phi)\end{pmatrix}=\begin{pmatrix}r(\cos\theta\cos\phi-\sin\theta\sin\phi)\\r(\sin\theta\cos\phi+\cos\theta\sin\phi)\end{pmatrix}\\ =\underbrace{\begin{pmatrix}\cos\phi & -\sin\phi\\\sin\phi & \cos\phi\end{pmatrix}}_{\mathbf R(\phi)}\underbrace{\begin{pmatrix}r\cos\theta\\r\sin\theta\end{pmatrix}}_{\mathbf v}=\mathbf R(\phi)\mathbf v$

在三维情况下，一般会对围绕 $x, y, z$ 轴的旋转矩阵记为 $\mathbf R_x(\phi),\mathbf R_y(\phi),\mathbf R_z(\phi)$ ：
$\mathbf R_x(\phi)=\begin{pmatrix}1&0&0&0\\0&\cos(\phi)&-\sin(\phi)&0\\0&\sin(\phi)&\cos(\phi)&0\\0&0&0&1\end{pmatrix},\\ \mathbf R_y(\phi)=\begin{pmatrix}\cos(\phi)&0&\sin(\phi)&0\\0&1&0&0\\-\sin(\phi)&0&\cos(\phi)&0\\0&0&0&1\end{pmatrix},\\ \mathbf R_z(\phi)=\begin{pmatrix}\cos(\phi)&-\sin(\phi)&0&0\\\sin(\phi)&\cos(\phi)&0&0\\0&0&1&0\\0&0&0&1\end{pmatrix}$

旋转矩阵的迹为： $\mathrm{tr}(\mathbf R)=1+2\cos(\phi)$ ；行列式为1，且是正交的。

旋转矩阵的逆矩阵： $\mathbf R_i^{-1}(\phi)=\mathbf R_i(-\phi)$ 。

1.3 缩放

缩放矩阵： $\mathbf S(\mathbf s)=\mathbf S(s_x,s_y,s_z)$ ，表示实体在 $x, y, z$ 轴方向上的缩放因子为 $s_x,s_y,s_z$ 。

$\mathbf S(\mathbf s)=\begin{pmatrix}s_x&0&0&0\\0&s_y&0&0\\0&0&s_z&0\\0&0&0&1\end{pmatrix}$

如果 $s_x=s_y=s_z$ ，那么这个缩放矩阵是各向同性的（isotropic），否则是各向异性的（anisotropic）。逆矩阵为 $\mathbf S^{-1}=\mathbf S(1/s_x,1/s_y,1/s_z)$ 。

特殊的缩放矩阵：其中一个或三个缩放因子是负数时，称为反射矩阵或镜像矩阵。但如果是两个缩放因子是负数，那么相当于旋转了 $\pi$ 弧度。反射矩阵会导致顶点顺序发生改变。

判断一些列变换矩阵的组合是否为反射矩阵的方法：计算变换矩阵左上角 $3\times3$ 元素的行列式，如果行列式为负数，那么就为反射矩阵。

1.4 切变

六种基础的切变矩阵： $\mathbf H_{xy}(s),\mathbf H_{xz}(s),\mathbf H_{yx}(s),\mathbf H_{yz}(s),\mathbf H_{zx}(s),\mathbf H_{zy}(s)$ ，第一个下标表示哪个坐标会因切变矩阵而改变，第二个下标表示哪个坐标执行切变。在切变矩阵中，这两个下标也对应着参数 $s$ 的行和列，如：
$\mathbf H_{xz}(s)=\begin{pmatrix}1&0&s&0\\0&1&0&0\\0&0&1&0\\0&0&0&1\end{pmatrix}$

逆矩阵为： $\mathbf H_{ij}^{-1}=\mathbf H_{ij}(-s)$ 。

另一种切变： $\mathbf H_{xy}^{\prime}(s,t)=\begin{pmatrix}1&0&s&0\\0&1&t&0\\0&0&1&0\\0&0&0&1\end{pmatrix}$ ，表示下标表示的两个坐标会被第三个坐标改变。可以看作是两个基础切变的组合： $\mathbf H_{ij}^{\prime}(s,t)=\mathbf H_{ik}(s)\mathbf H_{jk}(t)$ 。

切变矩阵的行列式为1，所以是体积不变的变换。

1.5 变换的串联

变换矩阵串联是需要考虑顺序的。串联的目的是为了提升性能。

变换矩阵串联满足结合律： $\mathbf A\mathbf B\mathbf C=(\mathbf A\mathbf B)\mathbf C$ 。

1.6 刚体变换

刚体变换表示保持物体长度、角度、手性不变的变换，即仅有平移和旋转变换进行串联。可以表示为：
$\mathbf X=\mathbf T(\mathbf t)\mathbf R=\begin{pmatrix}r_{00}&r_{01}&r_{02}&t_x\\r_{10}&r_{11}&r_{12}&t_y\\r_{20}&r_{21}&r_{22}&t_z\\0&0&0&1\end{pmatrix}$
其逆变换为 $\mathbf X^{-1}=(\mathbf T(\mathbf t)\mathbf R)^{-1}=\mathbf R^T\mathbf T(-\mathbf t)$ ，即左上角 $3\times3$ 的旋转矩阵转置，平移矩阵的元素值改变符号，并依照逆序相乘。
另一种计算方式：假设 $\mathbf R$ 为 $3\times3$ 的旋转矩阵， $\mathbf X$ 表示刚体变换矩阵：
$\bar{\mathbf R}=\begin{pmatrix}\mathbf r_{,0}&\mathbf r_{,1}&\mathbf r_{,2}\end{pmatrix}=\begin{pmatrix}\mathbf r_{0,}^T\\\\\mathbf r_{1,}^T\\\\\mathbf r_{2,}^T\end{pmatrix},\\ \mathbf X=\begin{pmatrix}\bar{\mathbf R}&\mathbf t\\\mathbf 0^T&1\end{pmatrix}$
那么逆变换可以表示为：
$\mathbf X^{-1}=\begin{pmatrix}\mathbf r_{0,}&\mathbf r_{1,}&\mathbf r_{2,}&-\bar{\mathbf R}^T\mathbf t\\0&0&0&1\end{pmatrix}$

1.7 法线变换

基础变换可以应用于线和面的切线向量，但是有些情况下不能直接应用于法线向量。

正确的应用方式应为使用变换矩阵的伴随矩阵的转置。在变化之后可能需要归一化。

简化：

使用逆矩阵代替伴随矩阵；因为伴随矩阵是逆矩阵除以行列式计算得来；
法线是一个向量，所以平移不会对其产生影响；大部分变换是仿射的，即无投影；所以可以仅计算左上 $3\times3$ 的部分；
如果变换完全是由平移、旋转和各向同性的缩放变换串联的；因为平移不影响法线，各向同性的缩放只影响法线长度，旋转矩阵的逆矩阵为其转置；这种情况下，原变换矩阵可以直接应用于法线；
如果只有平移和旋转，那么不需要重新归一化；如果有各向同性的缩放，那么归一化只需要除以缩放比例即可，或变换矩阵的左上 $3\times3$ 部分除以缩放比例即可。

1.8 逆变换的计算

三种计算方式：

如果矩阵是单一变换或是一些列已知参数的简单变换，那么可以通过各个矩阵的逆矩阵逆序得到。简单且保证精度；
如果已知变换矩阵是正交的，那么转置即为逆矩阵： $\mathbf M^{-1}=\mathbf M^T$ ；
如果以上都未知，那么可以使用伴随矩阵方法、克莱尔法则（Cramer’s rule）、LU分解、高斯消元法等方法来计算逆矩阵；其中高斯消元法和伴随矩阵方法更好一些，可以使用更少的if判断；

二、特殊的矩阵变换和操作

2.1 欧拉变换

欧拉变换是一种直观的描述实体方向的变换。默认以负 $z$ 轴作为视角方向， $y$ 轴为上方向。
欧拉变换示意图

记为： $\mathbf E(h,p,r)=\mathbf R_z(r)\mathbf R_x(p)\mathbf R_y(h)$ 。可以有24种不同顺序，这里是常用形式。

逆变换： $\mathbf E^{-1}=\mathbf E^T=(\mathbf R_z\mathbf R_x\mathbf R_y)^T=\mathbf R_y^T\mathbf R_x^T\mathbf R_z^T$ 。

欧拉角 $h, p, r$ 可以直观的表示为“摇头/偏航（飞行术语）”、“俯仰”、“翻滚”。

欧拉角的缺点：

视场的上方向并不能特指世界坐标的上方向；
两组欧拉角很难合并；如做两组欧拉角的过度动画；
多组欧拉角可以表示同一个方向;
可能会产生gimbal lock；

2.2 从欧拉变换中提取参数

该过程从正交矩阵中计算欧拉参数，即 $h, p, r$ 。因为都是旋转矩阵，所以可以用变换矩阵的左上角 $3\times3$ 来表示。

$\mathbf E(h,p,r)=\begin{pmatrix}e_{00}&e_{01}&e_{02}\\e_{10}&e_{11}&e_{12}\\e_{20}&e_{21}&e_{22}\end{pmatrix}=\mathbf R_z(r)\mathbf R_x(p)\mathbf R_y(h)$

可以得到
$\mathbf E=\begin{pmatrix}\cos r\cosh-\sin r\sin p\sin h & -\sin\ r\cos\ p & \cos r\sin h+\sin r\sin p\cos h\\ \sin r\cos h+\cos r\sin p\sin h & \cos r\cos p & \sin r\sin h-\cos r\sin p\cos h\\ -\cos p\sin h & \sin p & \cos p\cos h\end{pmatrix}$

从式中可以得到 $\cfrac{ e_{01}}{ e_{11}}=\cfrac{-\sin r}{\cos r}=-\tan r \quad \textrm{and} \quad \cfrac{e_{20}}{e_{22}}=\cfrac{-\sin h}{\cos h}=-\tan h$ 。可得
$\begin{array}{lcl} h = \mathrm{atan2}(-e_{20},e_{22}),\\ p = \arcsin(e_{21}),\\ r = \mathrm{atan2}(-e_{01},e_{11}) \end{array}$

这里有一个特殊情况，当 $\cos p=0$ 时，会出现gimbal lock，即 $r$ 和 $h$ 会围绕同一个轴旋转（可能是不同方向，取决于 $p$ 为 $-\pi/2$ 或 $\pi/2$ ）。那么会出现数值不稳定性。

产生gimbal lock的原因是丢失了一个自由度。从数字层面来看，当 $\cos p=0$ ，即 $p=\pm\pi/2+2\pi k,\ k\ \textrm{is an integer}$ ，会丢失一个自由度，矩阵 $\mathbf E$ 仅依赖与一个角度， $r + h$ 或 $r - h$ 。

2.3 矩阵分解

矩阵分解的任务是从一个串联的矩阵中找回一些列变换。

矩阵分解的用途：

提取物体的缩放比例；
找到特定系统所需要的变换；
确定模型是否仅有刚体变换；
动画的关键帧插值；
从旋转矩阵中移除切变；

简单的分解： $4\times4$ 矩阵最右一列为平移矩阵；可以通过行列式正负性确定是否有反射；

2.4 围绕任意轴旋转

基本方法

假设围绕 $\mathbf r$ 轴旋转 $\alpha$ 弧度。首先变换矩阵 $\mathbf M$ 变换到可以围绕 $x$ 轴旋转的空间，然后执行旋转操作，最后再通过 $\mathbf M^{-1}$ 变换回原空间。

为了计算 $\mathbf M$ ，首先需要找到另外两个与 $\mathbf r$ 正交的轴，且这两轴互相正交。假设两轴为 $\mathbf s, \mathbf t$ ，则 $\mathbf t=\mathbf r\times\mathbf s$ 。 $\mathbf s$ 的计算方式：将 $\mathbf r$ 的绝对值最小分量置为 $0$ ；交换剩余两个分量，然后将它们之中的第一个分量改变正负性；
$\begin{array}{lcl} \bar{\mathbf s}=\begin{cases} (0,-r_z,r_y),\ \textrm{if}\ |r_x| \le |r_y|\ \textrm{and}\ |r_x| \le |r_z|,\\ (-r_z,0,r_x),\ \textrm{if}\ |r_y| \le |r_x|\ \textrm{and}\ |r_y| \le |r_z|,\\ (-r_y,r_x,0),\ \textrm{if}\ |r_z| \le |r_x|\ \textrm{and}\ |r_z| \le |r_y|,\end{cases}\\ \mathbf s=\bar{\mathbf s}/\|\bar{\mathbf s}\|,\\ \mathbf t=\mathbf r\times\mathbf s \end{array}$

这可以保证 $\bar{\mathbf s}$ 正交于 $\mathbf r$ ，且 $(\mathbf r,\mathbf s,\mathbf t)$ 是一组正交基。则旋转矩阵 $\mathbf M=\begin{pmatrix}\mathbf r^T\\\mathbf s^T\\\mathbf t^T\end{pmatrix}$ ，会将 $\mathbf r$ 转至 $x$ 轴， $\mathbf s$ 转至 $y$ 轴， $\mathbf t$ 转至 $z$ 轴，然后使用 $\mathbf R_x(\alpha)$ 围绕 $x$ 轴旋转，最后使用 $\mathbf M$ 的逆矩阵变回原空间，这里 $\mathbf M^{-1}=\mathbf M^T$ 。即最终变换矩阵为： $\mathbf X=\mathbf M^T\mathbf R_x(\alpha)\mathbf M$ 。

另一种方法

假设围绕归一化的轴 $\mathbf r$ 旋转 $\phi$ 弧度，可以得到变换矩阵：
$\mathbf R=\begin{pmatrix} \cos\phi+(1-\cos\phi)r_x^2 & (1-\cos\phi)r_xr_y-r_z\sin\phi & (1-\cos\phi)r_xr_z+r_y\sin\phi \\ (1-\cos\phi)r_xr_y+r_z\sin\phi & \cos\phi+(1-\cos\phi)r_y^2 & (1-\cos\phi)r_yr_z-r_x\sin\phi \\ (1-\cos\phi)r_xr_z-r_y\sin\phi & (1-\cos\phi)r_yr_z+r_x\sin\phi & \cos\phi+(1-\cos\phi)r_z^2 \end{pmatrix}$

三、四元数

四元数用于表示旋转和指向。任意的三维指向都可以表示为一个围绕特定轴的旋转。四元数可以用于稳定且恒定的指向插值。

四元数有四个部分，其中前三个值与旋转轴密切相关，二旋转的角度则会影响所有四个部分的值。

3.1 数学背景

定义：四元数 $\hat{\mathbf q}$ 可以通过以下方式定义，
$\hat{\mathbf q}=(\mathbf q_v,q_w)=iq_x+jq_y+kq_z+q_w=\mathbf q_v+q_w,\\ \mathbf q_v=iq_x+jq_y+kq_z=(q_x,q_y,q_z),\\ i^2=j^2=k^2=-1,\ jk=-kj=i,\ ki=-ik=j,\ ij=-ji=k$
其中， $q_w$ 为四元数 $\hat{\mathbf q}$ 的实部， $\mathbf q_v$ 是虚部， $i, j, k$ 为虚数单位。

对于虚部 $\mathbf q_v$ ，可以使使用所有单位向量的操作，如加法、减法、点乘、叉乘等。两个四元数 $\hat{\mathbf q}$ 和 $\hat{\mathbf r}$ 的乘法有如下定义，需要注意的是，四元数的虚部相乘不符合交换律：
$\hat{\mathbf q}\hat{\mathbf r}=(iq_x+jq_y+kq_z+q_w)(ir_x+jr_y+kr_z+r_w)\\ =i(q_yr_z-q_zr_y+r_wq_x+q_wr_x)\\ +j(q_zr_x-q_xr_z+r_wq_y+q_wr_y)\\ +k(q_xr_y-q_yr_x+r_wq_z+q_wr_z)\\ +q_wr_w-q_xr_x-q_yr_y-q_zr_z\\ =(\mathbf q_v\times\mathbf r_v+r_w\mathbf q_v+q_w\mathbf r_v,\ q_wr_w-\mathbf q_v\cdot\mathbf r_v)$

加法： $\hat{\mathbf q}+\hat{\mathbf r}=(\mathbf q_v,q_w)+(\mathbf r_v,r_w)=(\mathbf q_v+\mathbf r_v,q_w+r_w)$
共轭： $\hat{\mathbf q}^*=(\mathbf q_v,q_w)^*=(-\mathbf q_v,q_w)$
范数： $\begin{array}{c}n(\hat{\mathbf q})=\sqrt{\hat{\mathbf q}\hat{\mathbf q}^*}=\sqrt{\hat{\mathbf q}^*\hat{\mathbf q}}=\sqrt{\mathbf q_v\cdot\mathbf q_v+q_w^2}\\ =\sqrt{q_x^2+q_y^2+q_z^2+q_w^2}\end{array}$ ，有时记为： $\|\hat{\mathbf q}\|$
单位四元数： $\hat{\mathbf i}=(\mathbf 0,1)$
乘法倒数： $\hat{\mathbf q}^{-1}=\cfrac{1}{n(\hat{\mathbf q})^2}\hat{\mathbf q}^*$
标量乘法符合交换律： $\hat{\mathbf q}s=s\hat{\mathbf q}=(s\mathbf q_v,sq_w)$
共轭规则： $\begin{array}{l}(\hat{\mathbf q}^*)^*=\hat{\mathbf q},\\ (\hat{\mathbf q}+\hat{\mathbf r})^*=\hat{\mathbf q}^*+\hat{\mathbf r}^*,\\ (\hat{\mathbf q}\hat{\mathbf r})^*=\hat{\mathbf r}^*\hat{\mathbf q}^*\end{array}$
范数规则： $\begin{array}{l}n(\hat{\mathbf q}^*)=n(\hat{\mathbf q}),\\ n(\hat{\mathbf q}\hat{\mathbf r})=n(\hat{\mathbf q})n(\hat{\mathbf r})\end{array}$
乘法线性： $\begin{array}{l}\hat{\mathbf p}(s\hat{\mathbf q}+t\hat{\mathbf r})=s\hat{\mathbf p}\hat{\mathbf q}+t\hat{\mathbf p}\hat{\mathbf r},\\ (s\hat{\mathbf p}+t\hat{\mathbf q})\hat{\mathbf r}=s\hat{\mathbf p}\hat{\mathbf r}+t\hat{\mathbf q}\hat{\mathbf r}\end{array}$
乘法结合律： $\hat{\mathbf p}(\hat{\mathbf q}\hat{\mathbf r})=(\hat{\mathbf p}\hat{\mathbf q})\hat{\mathbf r}$

单位四元数，即 $n(\hat{\mathbf q})=1$ ，可以记为： $\hat{\mathbf q}=(\sin\phi\mathbf u_q,\cos\phi)=\sin\phi\mathbf u_q+\cos\phi$ ，其中 $\|\mathbf u_q\|=1$

单位四元数的欧拉公式： $\hat{\mathbf q}=\sin\phi\mathbf u_q+\cos\phi=e^{\phi\mathbf u_q}$
对数： $\log(\hat{\mathbf q})=\log(e^{\phi\mathbf u_q})=\phi\mathbf u_q$
幂： $\hat{\mathbf q}^t=(\sin\phi\mathbf u_q+\cos\phi)^t=e^{\phi t\mathbf u_q}=\sin(\phi t)\mathbf u_q+\cos(\phi t)$

3.2 四元数变换

四元数变换针对的是有单位长度的四元数，即单位四元数（unit quaternions）。单位四元数可以表示任何的三维旋转，并且表示形式非常简单紧凑。

假设一个点或向量 $\mathbf p=\begin{pmatrix}p_x&p_y&p_z&p_w\end{pmatrix}^T$ ，将其各分量表示为四元数 $\hat{\mathbf p}$ ，给定单位四元数 $\hat{\mathbf q}=(\sin\phi\mathbf u_q,\cos\phi)$ ，那么 $\hat{\mathbf q}\hat{\mathbf p}\hat{\mathbf q}^{-1}$ 表示 $\mathbf p$ 围绕轴 $\mathbf u_q$ 旋转 $2\phi$ 弧度。

$\hat{\mathbf q}$ 乘以任意非零数，都表示同样的旋转；也就是说将旋转轴 $\mathbf u_q$ 方向指向其负方向，并且将 $q_w$ 改变符号，那么可以创造出与原四元数表示相同旋转的四元数；同样也意味着，一个旋转矩阵可以推导出两个四元数，即 $\hat{\mathbf q},-\hat{\mathbf q}$ 。

给定两个单位四元数 $\hat{\mathbf q}$ 和 $\hat{\mathbf r}$ ，串联应用： $\hat{\mathbf r}(\hat{\mathbf q}\hat{\mathbf p}\hat{\mathbf q}^*)\hat{\mathbf r}^*=(\hat{\mathbf r}\hat{\mathbf q})\hat{\mathbf p}(\hat{\mathbf r}\hat{\mathbf q})^*=\hat{\mathbf c}\hat{\mathbf q}\hat{\mathbf c}^*$ ，其中 $\hat{\mathbf c}=\hat{\mathbf r}\hat{\mathbf q}$ ，且为单位四元数。

矩阵转换

从单位四元数转化为变换矩阵

$\hat{\mathbf q}\hat{\mathbf p}\hat{\mathbf q}^{-1}$ 可以表示如下矩阵：
$\mathbf M^q=\begin{pmatrix}1-s(q_y^2+q_z^2)&s(q_xq_y-q_wq_z)&s(q_xq_z+q_wq_y)&0\\ s(q_xq_y+q_wq_z)&1-s(q_x^2+q_z^2)&s(q_yq_z-q_wq_x)&0\\ s(q_xq_z-q_wq_y)&s(q_yq_z+q_wq_x)&1-s(q_x^2+q_y^2)&0\\ 0&0&0&1\end{pmatrix}$
其中，标量 $s=2/(n(\hat{\mathbf q}))^2$ ，那么对于单位矩阵，则可以简化为：
$\mathbf M^q=\begin{pmatrix}1-2(q_y^2+q_z^2)&2(q_xq_y-q_wq_z)&2(q_xq_z+q_wq_y)&0\\ 2(q_xq_y+q_wq_z)&1-2(q_x^2+q_z^2)&2(q_yq_z-q_wq_x)&0\\ 2(q_xq_z-q_wq_y)&2(q_yq_z+q_wq_x)&1-2(q_x^2+q_y^2)&0\\ 0&0&0&1\end{pmatrix}$
因为四元数已经建立，所以不需要计算任何的三角函数，所以在实际应用中，效率更高。

从变换矩阵转化为单位四元数

可从 $\mathbf M^q$ 中得到如下关键信息：
$\begin{array}{l}m_{21}^q-m_{12}^q=4q_wq_x,\\ m_{02}^q-m_{20}^q=4q_wq_y,\\ m_{10}^q-m_{01}^q=4q_wq_z\end{array}$

$\mathbf M^q$ 的迹可以如下计算：
$\mathrm{tr}(\mathbf M^q)=4-2s(q_x^2+q_y^2+q_z^2)=4\left(1-\frac{q_x^2+q_y^2+q_z^2}{q_x^2+q_y^2+q_z^2+q_w^2}\right)\\ =\frac{4q_w^2}{q_x^2+q_y^2+q_z^2+q_w^2}=\frac{4q_w^2}{(n(\hat{\mathbf q}))^2}$

综上可以得到：
$q_w=\frac{1}{2}\sqrt{\mathrm{tr}(\mathbf M^q)},\quad q_x=\frac{m_{21}^q-m_{12}^q}{4q_w},\\ q_y=\frac{m_{01}^q-m_{20}^q}{4q_w},\quad q_z=\frac{m_{10}^q-m_{01}^q}{4q_w}$

从数值稳定性方面来看，需要避免除以小数字，因此另一种计算方式：首先设 $t=q_w^2-q_x^2-q_y^2-q_z^2$ ，那么可以得到如下：
$m_{00}=t+2q_x^2,\\ m_{11}=t+2q_y^2,\\ m_{22}=t+2q_z^2,\\ u=m_{00}+m_{11}+m_{22}=t+2q_w^2$
这里通过 $m_{00},m_{11},m_{22},u$ 来确定 $q_x,q_y,q_z,q_w$ 哪个最大，如果是 $q_w$ 最大，则使用上述的结论；否则，使用如下方式计算：
$4q_x^2=+m_{00}-m_{11}-m_{22}+m_{33},\\ 4q_y^2=-m_{00}+m_{11}-m_{22}+m_{33},\\ 4q_z^2=-m_{00}-m_{11}+m_{22}+m_{33},\\ 4q_w^2=\mathrm{tr}(\mathbf M^q)$

使用相应的方程计算出最大 $q_x,q_y,q_z,q_w$ 的最大值，然后使用最开始的关键信息计算出 $\hat{\mathbf q}$ 的其余分量。

球面线性插值

球面线性插值表示的是，给定两个单位四元数 $\hat{\mathbf q},\hat{\mathbf r}$ ，以及一个参数 $t\in [0,1]$ ，来计算一个插值后的四元数。

代数形式的表示： $\hat{\mathbf s}(\hat{\mathbf q},\hat{\mathbf r},t)=(\hat{\mathbf r}\hat{\mathbf q}^{-1})^t\hat{\mathbf q}$ 。
对于软件实现来说，使用 $s l e r p$ 函数来表示更合适： $\hat{\mathbf s}(\hat{\mathbf q},\hat{\mathbf r},t)=\mathrm{slerp}(\hat{\mathbf q},\hat{\mathbf r},t)=\cfrac{\sin(\phi(1-t))}{\sin\phi}\hat{\mathbf q}+\cfrac{\sin(\phi t)}{\sin\phi}\hat{\mathbf r}$ 。可以利用 $\cos\phi=q_xr_x+q_yr_y+q_zr_z+q_wr_w$ 来计算 $\phi$ 。对于 $t\in [0,1]$ 来说可以插值出唯一的四元数，且这些插值可以组成在单位四元数 $\hat{\mathbf q}(t=0),\hat{\mathbf r}(t=1)$ 之间的最短球面弧。且计算出的插值，是围绕固定轴以恒定速度旋转，无加速度；这种曲线称为测地曲率（geodesic curve）。

Slerp函数特别适合做两个指向的插值。但是在实际应用中，直接计算球面线性插值是比较消耗的操作，因为包含快乐三角函数的计算。有些优化方法可以用来优化性能。

当两个以上指向，如： $\hat{\mathbf q}_0,\hat{\mathbf q}_1,...,\hat{\mathbf q}_{n-1}$ ，依次插值，可以直接使用slerp函数；但是直接使用，会产生突变。更好的办法是使用样条来插值。在 $\hat{\mathbf q}_i,\hat{\mathbf q}_{i+1}$ 之间引入 $\hat{\mathbf a}_i,\hat{\mathbf a}_{i+1}$ ，可以通过他们实现球面三次插值。其中 $\hat{\mathbf a}_i=\hat{\mathbf q}_i\exp\left[-\cfrac{\log(\hat{\mathbf q}_i^{-1}\hat{\mathbf q}_{i-1})+\log(\hat{\mathbf q}_i^{-1}\hat{\mathbf q}_{i+1})}{4}\right]$ 。
使用光滑的三次样条来进行球面线性插值可如下计算：
$\begin{array}{l} \mathrm{squad}(\hat{\mathbf q}_i,\hat{\mathbf q}_{i+1},\hat{\mathbf a}_i,\hat{\mathbf a}_{i+1},t)=\\ \quad\mathrm{slerp}(\mathrm{slerp}(\hat{\mathbf q}_i,\hat{\mathbf q}_{i+1},t),\mathrm{slerp}(\hat{\mathbf a}_i,\hat{\mathbf a}_{i+1},t),2t(1-t)) \end{array}$
这个插值会经过 $\hat{\mathbf q}_i,\ i\in [0,...,n-1]$ ，但不会经过 $\hat{\mathbf a}_i$ ， $\hat{\mathbf a}_i$ 表示的是切线方向。

从一个向量旋转至另一个

计算从 $\mathbf s$ 方向以最短路径变换至另一个方向 $\mathbf t$ 。
首先，归一化 $\mathbf s,\mathbf t$ ；然后计算单位旋转轴 $\mathbf u=(\mathbf s\times\mathbf t)/\|\mathbf s\times\mathbf t\|$ ；
第二步， $e=\mathbf s\cdot\mathbf t=\cos(2\phi),\ \|\mathbf s\times\mathbf t\|=\sin(2\phi)$ ，其中 $2\phi$ 是 $\mathbf s,\mathbf t$ 之间的旋转角；
可得到四元数 $\hat{\mathbf q}=(\sin\phi\mathbf u,\cos\phi)=(\cfrac{\sin\phi}{\sin2\phi}(\mathbf s\times\mathbf t),\cos\phi)$ ，通过三角函数的半角公式可以化简为：
$\hat{\mathbf q}=(\mathbf q_v,q_w)=\left(\cfrac{1}{\sqrt{2(1+e)}}(\mathbf s\times\mathbf t),\cfrac{\sqrt{2(1+e)}}{2}\right)$

直接通过这种方法生成四元数，相较于归一化叉乘，可在 $\mathbf s,\mathbf t$ 指向相近方向时，避免出现数值不稳定性。但是当 $\mathbf s,\mathbf t$ 指向相反方向时，两种方法都无法避免数值不稳定性。当这种情况出现时，任何垂直于 $\mathbf s$ 的轴，都可以用来作为旋转轴。

对应的旋转矩阵为： $\mathbf R(\mathbf s,\mathbf t)=\begin{pmatrix}e+hv_x^2 & hv_xv_y-v_z & hv_xv_z+v_y & 0\\ hv_xv_y+v_z & e+hv_y^2 & hv_yv_z-v_x & 0\\ hv_xv_z-v_y & hv_yv_z+v_x & e+hv_z^2 & 0\\ 0 & 0 & 0 & 1\end{pmatrix}$ ，其中， $\mathbf v=\mathbf s\times\mathbf t,\ e=\cos(2\phi)=\mathbf s\cdot\mathbf t,\ h=\cfrac{1-\cos(2\phi)}{\sin^2(2)\phi}=\cfrac{1-e}{\mathbf v\cdot\mathbf v}=\cfrac{1}{1+e}$ 。可以看到，通过简化，所有的开方和三角函数都消失了，所以该方法非常高效。