Perspective Matrix的另一种推导

最新推荐文章于 2024-08-16 11:26:32 发布

原创最新推荐文章于 2024-08-16 11:26:32 发布 · 1.4k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#opengl

OpenGL 专栏收录该内容

5 篇文章

订阅专栏

本文通过线性代数方法详细推导OpenGL投影矩阵，解释第三行系数的选择原因，并介绍了射影矩阵的概念及其在图形学中的应用。

OpenGL投影矩阵的常见推导在OpenGL Projection Matrix中已经详细地给出了，但是作者似乎没有给出第三行的系数的由来。这里我再给出一种使用线性代数方法的推导，从中读者可以明白为第三行系数是那样选取的。

这里的推导参考了《Computer Graphics - Principle and Practice》3rd的第13章（在扩展材料中给出了详细的推导，不过需要注意的是，扩展材料中的推导是从standard view volume到canonical view volume，与OpenGL或DX中的投影矩阵稍有不同。），以及《Multi View Geometry》中p34的一个例子。

投影矩阵是一种射影矩阵（Projective Matrix），射影矩阵根据《Multi View Geometry》[1]中的定义，是一个可逆矩阵，并且在变换过程中保留共线性质，而OpenGL的投影矩阵也是一种射影矩阵，我们可以通过线性代数的方法来求得对应的投影变换。

对于P3中的射影变换对应的矩阵，总共有16个元素，由于P3中的点是齐次坐标，所以总共有15个自由度（即15个变量），所以我们只需要15个方程就能够求得对应的矩阵。这里是15个自由度而不是16的原因是，对于点p和q，我们称它们是等价的，当q=kp（k != 0）。于是对于任意射影变换M，有

$等价变换$

也就是说M的任意倍数与M也是等价的。

我们只需要选取5个对应的点，就可以得到15个方程，因为每个R3中的点有3个分量。这里选取对应点时需要注意，需要使得他们在general position，也就是任意4个点不能是共面的，或者说，点P不能表示为其他3个点仿射组合，否则我们在求解矩阵M时不能得到唯一的解（这里的唯一解是关于某个倍数的，因为有16个未知数，而我们只有15个方程，显然对应的线性方程组系数矩阵不是满秩的，于是不能有一般意义上的唯一解，但是因为只有一个自由变量，其他基本变量都是这个自由变量的倍数，所以我们依然可以得到一个唯一的射影矩阵）。

在frustum中选取如下5个点以及变化后在cvv上的对应点（这里是R3中的点，对应的P3中的点可以通过添加分量w=1得到）：

$Corresponding points$

这里n、f分别是near和far平面的距离，b为aspect ratio，a为tan(fov/2)。

假设射影矩阵为

$projective matrix$

对于P3中任意点p=(x,y,z,1)，经过M变换后的点为q’(x1,y1,z1,w1)，我们可以得到q’对应的R3中的点q = q’/w1，所以有

$transformation$

$\begin{align*} x a_{00} + y a_{01} + z a_{02} + a_{03} &= x_1 \\ x a_{30} + y a_{31} + z a_{32} + a_{33} &= w_1 \\ \frac{x_1}{w_1} &= x' \\ x'(x a_{30} + y a_{31} + z a_{32} + a_{33}) &= x a_{00} + y a_{01} + z a_{02} + a_{03} \end{align*}$