矩阵论 •「线性变换」

原创已于 2025-06-12 18:35:56 修改 · 969 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#矩阵 #线性代数

于 2024-11-07 21:27:32 首次发布

Mathematics 专栏收录该内容

4 篇文章

订阅专栏

线性变换

关于变换：在两个集合之间可以定义一个映射。当集合为数集时，我们称这个映射为“函数”；当集合为线性空间时，就称这个映射为“变换”（之所以叫变换，隐含了一种运动的思想）。“变换”实际上就是“函数”的一种花哨的说法，只是在线性代数中，变换主要考虑作用的是线性空间中的元素，而不是函数中的数字；线性空间中的元素可以简单理解为向量.

线性变换

定义：设 $V$ 是一个线性空间， $T$ 是 $V$ 到自身的一个映射，对于 $V$ 中的任意元素 $v⃗\vec{v}$ 均存在唯一的 $v′⃗∈V\vec{v'} \in V$ 与之对应，则称 $T$ 为线性空间 $V$ 上的一个变换，记为 $Tv⃗=v′⃗T\vec{v}=\vec{v'}$ （注意：“到自身”限定了变换矩阵为方阵？）一个变换可以非常复杂，然而幸运的是，线性变换对变换进行了限定，是一种特殊的变换；向量的线性运算有加法和数量乘法，那么线性变换顾名思义，就是针对向量的线性运算的变换，它满足：
$\begin{align} T(\vec{x} + \vec{y}) &= T(\vec{x}) + T(\vec{y}) \\ T(k\vec{x}) &= kT(\vec{x}) \end{align}$
线性变换有一些性质和运算规律，在此做一些举例：

线性变换把零元素仍变为零元素（原点固定）；
线性变换把线性相关的元素组仍变为线性相关的元素组，但线性无关的元素组经过线性变换不一定再是线性无关的（例如降维）；
线性变换的和 $T1+T2:∀x⃗∈V,(T1+T2)x⃗=T1x⃗+T2x⃗T_1+T_2\text{:}\quad\forall \vec{x}\in V\text{,}\quad(T_1+T_2)\vec{x}=T_1\vec{x}+T_2\vec{x}$ ；
线性变换的数乘 $kT:∀x⃗∈V,(kT)x⃗=k(Tx⃗)kT:\quad\forall \vec{x}\in V\text{,}\quad(kT)\vec{x}=k(T\vec{x})$ ；
线性变换的乘积 $T1T2:∀x⃗∈V,(T1T2)x⃗=T1(T2x⃗)T_1T_2:\quad\forall \vec{x}\in V\text{,}(T_1T_2)\vec{x}=T_1(T_2\vec{x})$ ；

通常，线性变换的乘积不满足交换律，且不是所有的变换都具有逆变换；这对应着矩阵的乘积和逆.

线性变换的矩阵表示 ⭐

线性空间是一个非常抽象的概念，线性空间中的元素可以多种多样。线性变换的矩阵表示目的在于：把一个线性空间上的线性变换（元素之间的映射），转化为了坐标之间的变换，并通过矩阵来描述这个变换。对任何线性空间，给定基后，我们对元素进行线性变换或线性运算时，只需用线性变换的矩阵右乘以元素的坐标“向量”即可。注意，实际上在这个变换的过程中，选择的描述这个线性空间 $V$ 的基不变。这样的话我们就可以通过矩阵 + 坐标来描述一个线性变换作用于一个抽象向量的过程；每当我们看到一个矩阵时，也都可以理解为是对线性空间（中元素的坐标）的一个线性变换。线性变换的矩阵表示推导过程如下：

考虑线性空间 $V$ 中的一个元素（向量） $v⃗\vec{v}$ ，显然该向量可以由基 ${v1⃗,v2⃗...,vn⃗}\{\vec{v_1},\vec{v_2}...,\vec{v_n}\}$ 和坐标联合进行唯一线性表示，即：

$\vec{v} = \sum_1^n k_i\vec{v_i} = \begin{bmatrix}\vec{v_1},\vec{v_2}...,\vec{v_n}\end{bmatrix} \begin{bmatrix}k_1 \\k_2 \\\vdots \\k_n\end{bmatrix}$

要确定一个线性变换 $T$ ，乍看起来，似乎需要把线性空间 $V$ 中所有向量在 $T$ 下的象全部找出来才行，事实上不必如此。因为 $T$ 是线性变换（变换前后线性组合系数不变），而 $V$ 中任一向量都可由基向量唯一线性表示，所以只要能够确定出 $V$ 的基向量的象（即确定基向量的运动），则 $V$ 中任一向量的象也就完全确定了。即下面公式所描述的：

$T\vec{v}= T(k_1\vec{v_1}+k_2\vec{v_2}+\cdots+k_n\vec{v_n})= \begin{bmatrix}T\vec{v_1},T\vec{v_2},\cdots,T\vec{v_n}\end{bmatrix} \begin{bmatrix}k_1\\k_2\\\vdots\\k_n\end{bmatrix}$

其中考虑 $Tvi⃗T\vec{v_i}$ ：线性变换限定在线性空间 $V$ 到自身，因此每一个 $Tvi⃗T\vec{v_i}$ 都可以由基 $v1⃗,v2⃗...,vn⃗\vec{v_1},\vec{v_2}...,\vec{v_n}$ 进行唯一线性表示，因此可以写为矩阵形式：

$\begin{bmatrix}T\vec{v_1},T\vec{v_2},\cdots,T\vec{v_n}\end{bmatrix} = \begin{bmatrix}\vec{v_1},\vec{v_2},\cdots,\vec{v_n}\end{bmatrix} \begin{bmatrix}a_{_{11}}a_{_{12}}\cdots a_{_{1n}}\\a_{_{21}}a_{_{22}}\cdots a_{_{2n}}\\\vdots \\a_{_{n1}}a_{_{n2}}\cdots a_{_{nn}}\end{bmatrix}= \begin{bmatrix}\vec{v_1},\vec{v_2},\cdots,\vec{v_n}\end{bmatrix} A$
矩阵 $A$ 称为线性变换 $T$ 在基 ${v1⃗,v2⃗...,vn⃗}\{\vec{v_1},\vec{v_2}...,\vec{v_n}\}$ 下的矩阵。考虑线性变换后的向量 $Tv⃗T\vec{v}$ ：因此向量 $Tv⃗T\vec{v}$ 利用原坐标 $,kn]T[k_1,k_2,\cdots,k_n]^{T}$ 表示就为：
$T\vec{v} = \begin{bmatrix}\vec{v_1},\vec{v_2},\cdots,\vec{v_n}\end{bmatrix}A \begin{bmatrix}k_1\\k_2\\\vdots\\k_n\end{bmatrix}$
于是向量 $Tv⃗T\vec{v}$ 在基 $v1⃗,v2⃗...,vn⃗\vec{v_1},\vec{v_2}...,\vec{v_n}$ 下的新的坐标为：
$\begin{bmatrix}k_1'\\k_2'\\\vdots\\k_n'\end{bmatrix} = A \begin{bmatrix}k_1\\k_2\\\vdots\\k_n\end{bmatrix}$
综上我们证明了，对任何线性空间，选定线性空间的基后，我们对线性空间中的元素进行线性变换或线性运算时，只需用线性变换的矩阵右乘元素的坐标“向量”，即可得到线性变换后的元素（向量）的新坐标。因此可以把一个线性空间中针对元素的线性变换（向量之间的映射），转化为元素坐标之间的变换，并通过矩阵来描述这个变换。故在后面的内容中着重研究矩阵和坐标“向量”。可以证明：选定一个基后，一个线性变换和代表它的矩阵一一对应；注意根据上面推导，实际上在这个变换的过程中，选择的描述线性空间 $V$ 的原始的基 $v1⃗,v2⃗...,vn⃗\vec{v_1},\vec{v_2}...,\vec{v_n}$ 不变。接下来要研究的是，如果我们看见了一个线性变换，那么这个线性变换的矩阵 $A$ 应该如何求？

线性变换矩阵的计算 ⭐

矩阵和坐标是绑定在一起的术语。根据上面的推导过程，一个变换后的向量的新的坐标应该等于矩阵 $A$ 乘以该向量变换前的坐标，考虑所有基向量变换后新的坐标和变换前坐标的关系，可以列一个 n 元方程组，从而应该可以计算出变换矩阵。以二维空间中的旋转这一线性变换为例，第一步选定标准单位正交基描述这个二维线性空间，如果逆时针旋转 $θ\theta$ 角，则两个基向量的坐标有如下变换：
$\begin{bmatrix} 1 \\ 0 \end{bmatrix} \rightarrow \begin{bmatrix} cos\theta \\ sin\theta \end{bmatrix} \quad , \quad \begin{bmatrix} 0 \\ 1 \end{bmatrix} \rightarrow \begin{bmatrix} -sin\theta \\ cos\theta \end{bmatrix}$
方程组的矩阵形式则为：
$\begin{bmatrix} cos\theta & -sin\theta \\ sin\theta & cos\theta \end{bmatrix} =A \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}$

等式两边同时右乘 $I^{-1}$ ，解得线性变换矩阵 $A$ 为：
$\begin{bmatrix} cos\theta & -sin\theta \\ sin\theta & cos\theta \end{bmatrix}$
因此，我们就知道了线性变换作用下，一个线性变换后的向量新的坐标 $x′=Ax\boldsymbol{x'} = A\boldsymbol{x}$ ；而要想知道这个向量本身，只需用坐标和初始时选定且不变的描述这个二维线性空间的基（在这里是标准单位正交基）做线性组合即可.

线性变换及矩阵的值域和核

设 $T$ 是线性空间 $V^n$ 上的一个线性变换：

$\{T\vec{v} \ |\ \vec{v} \in V^n\}$ 为线性变换 $T$ 的值域；
$v⃗∈Vn}N(T)=\{\vec{v} \ |\ T\vec{v}=\vec{0},\ \vec{v} \in V^n\}$ 称为线性变换 $T$ 的核；

因为选定基后，一个线性变换可以唯一地由一个矩阵来描述（反过来也成立，即一一对应），我们不妨用矩阵 $A$ 来代替线性变换 $T$ ，那么我们称：

$\{A\boldsymbol{x} \ |\ \boldsymbol{x} \in R^n\}$ 为矩阵 $A$ 的值域，也称为矩阵 $A$ 的列空间（Column Space）； $d im (C (A))$ 也称为矩阵 $A$ 的秩；
$x∈Rn}N(A)=\{\boldsymbol{x} \ |\ A\boldsymbol{x}=\boldsymbol{0},\ \boldsymbol{x} \in R^n\}$ 称为矩阵 $A$ 的核，也称为矩阵 $A$ 的零空间（Null Space）； $d im (N (A))$ 称为矩阵 $A$ 的零度；

关于列空间 $C (A)$ 、零空间 $N (A)$ 下节也会详细涉及。线性代数基本定理：列空间 $C (A)$ 的维数 + 零空间 $N (A)$ 的维数 = 矩阵 $A$ 的列数，即 $d im (C (A)) + d im (N (A)) = n$ ，注意到列空间的维数也就是矩阵 $A$ 的秩 $r (A)$

线性变换中的相似矩阵

一个线性变换和代表它的矩阵一一对应吗？不是的，前提是首先要为这个线性空间选定一个基。因此，两个矩阵即使不同，但也有可能表示的是同一个线性变换！表示同一个线性变换的矩阵，我们称之为互为相似的矩阵。「相似矩阵」定义：设 $A, B$ 是两个 n 阶矩阵，如果存在一个 $n$ 阶非奇异（满秩）矩阵 $P$ ，使得 $B = P^{-1}AP$ ，则称 $A$ 相似于 $B$ ，记为 $A∼BA\sim B$ .

🤣定理1： $n$ 阶方阵 $A$ 和 $B$ 相似的充要条件是 $A$ 和 $B$ 为同一线性变换在不同基下的矩阵。这一定理就是说，互为相似的矩阵，实际上代表同一个线性变换；只是由于选择描述线性空间的基不同，导致矩阵的形式不同；🤣定理2：设同一个线性变换 $T$ 在两个基 $,vn⃗}\{\vec{v_1},\vec{v_2},\cdots,\vec{v_n}\}$ 和 $,vn′⃗}\{\vec{v_1'},\vec{v_2'},\cdots,\vec{v_n'}\}$ 的矩阵分别为 $A$ 和 $B$ ，且 $,vn⃗]C[\vec{v_1'},\vec{v_2'},\cdots,\vec{v_n'}] = [\vec{v_1},\vec{v_2},\cdots,\vec{v_n}]C$ ，则： $B = C^{-1}AC$ ，即 $A$ 和 $B$ 互为相似矩阵。证明如下：首先根据线性变换的矩阵表示，有
$T[\vec{v_1},\vec{v_2},\cdots,\vec{v_n}] = [\vec{v_1},\vec{v_2},\cdots,\vec{v_n}]A \\ T[\vec{v_1'},\vec{v_2'},\cdots,\vec{v_n'}]=[\vec{v_1'},\vec{v_2'},\cdots,\vec{v_n'}]B \\$
结合条件，有：
$T[\vec{v_1'},\vec{v_2'},\cdots,\vec{v_n'}] = [\vec{v_1'},\vec{v_2'},\cdots,\vec{v_n'}]B = [\vec{v_1},\vec{v_2},\cdots,\vec{v_n}]CB \\ T[\vec{v_1'},\vec{v_2'},\cdots,\vec{v_n'}] = T[\vec{v_1},\vec{v_2},\cdots,\vec{v_n}]C = [\vec{v_1},\vec{v_2},\cdots,\vec{v_n}]AC \\$
所以：
$CB = AC, 即\ B = C^{-1}AC$