MIT 线性代数 Linear Algebra 30:线性变换和其矩阵形式

最新推荐文章于 2024-05-27 06:45:06 发布

原创最新推荐文章于 2024-05-27 06:45:06 发布 · 634 阅读

0 ·

CC 4.0 BY-SA版权

Linear Algebra 专栏收录该内容

29 篇文章

订阅专栏

本文介绍了线性变换的基本概念及其矩阵表示方法，并通过实例详细解释了如何选择不同的基来表达线性变换。

在这一节的开始，让我们先短暂忘记矩阵，研究什么是线性变换。实际上，线性变换是比矩阵更 general 的定义。只不过在 linear algebra 中我们用矩阵来分析线性变换。

线性变换

满足以下两个条件的变换 $T$ 我们称为线性变换
$T (v + w) = T (v) + T (W)$

$T (c v) = c T (v)$

可以看到，线性变换实际上就是一个线性函数：输入线性组合的输出等于输出的线性组合。

Fact 1: $T (0) = 0$ .

Example 1 (Projection): 投影是一种线性变换，比如我们考虑把空间中任意一个向量投影到地平线上，这个变换是线性的。

Example 2 (Rotation): 旋转也是一个线性变换，毕竟叠加后旋转还是旋转后叠加，效果是一样的。

Non-example 3 (Shifting the whole plane): 平移整个平面 (即把所有vector加一个constant vector $d\bm{d}$ ) 并不是线性变换.
下图很清晰可以看出，而且 $T (0) = 0$ 首先就不满足。

在这里插入图片描述
Non-example 4 (length): 取一个向量的长度 $T(v)=∥v∥T(\bm{v})=\|\bm{v}\|$ 并不是线性变换。

这个变换 $T:Rn→RT:\mathbb{R}^n\to\mathbb{R}$ , 但显然他不是线性变换因为 $T(−v)≠−T(v)T(-\bm{v})\neq -T(\bm{v})$ .

Fact 2: Matrix $A\bm{A}$ 是一种线性变换.

$A(cv+dw)=cAv+dAw\bm{A}(c\bm{v}+d\bm{w})=c\bm{A}\bm{v}+d\bm{A}\bm{w}$

Fact 3: 对于任意一个线性变换 $T$ , 如果我们选取了一组基 $v_1,v_2,...,v_n$ 来表示任意的输入，选取一组基 $w_1,w_2,...,w_m$ 来表示任意的输出，那么线性变换 $T$ 总能写成在这两组基下的矩阵形式。

线性变换的矩阵表示

如果输入基 $v1,v2,...,vn\bm{v_1},\bm{v_2},...,\bm{v_n}$ ，输出基 $w1,w2,...,wm\bm{w_1},\bm{w_2},...,\bm{w_m}$ 均已选取。我们怎么确定线性组合的矩阵形式尼？

其实很简单，我们只需要选取基变换坐标作为矩阵的每个entry即可，请看
$T(v1)=a11w1+a21w2+...+am1wmT(\bm{v_1})=a_{11} \bm{w_1} + a_{21}\bm{ w_2} + ... + a_{m1} \bm{w_m}$

$T(v2)=a12w1+a22w2+...+am2wmT(\bm{v_2})=a_{12}\bm{ w_1} + a_{22} \bm{w_2} + ... + a_{m2} \bm{w_m}$

$. . .$

$T(vm)=a1nw1+a2nw2+...+amnwmT(\bm{v_m})=a_{1n} \bm{w_1} + a_{2n} \bm{w_2} + ... + a_{mn} \bm{w_m}$

其中 $a_{mn}$ 即为基变换坐标的每个 entry。对于任意一个输入 $v\bm{v}$ ，它在 ${v1,v2,...,vn}\{\bm{v_1},\bm{v_2},...,\bm{v_n}\}$ 有一个坐标，如果我们把矩阵写成基的坐标，那么他经过线性变换后得到的刚刚好是输出 $T(v)T(\bm{v})$ 在 ${w1,w2,...,wm}\{\bm{w_1},\bm{w_2},...,\bm{w_m}\}$ 下的坐标。矩阵形式可以写为

$T(V)=WAT(\bm{V})=\bm{WA}$

Remark:

一般我们默认的极坐标是单位阵的各个column，但实际上我们可以选取任意线性独立的vector在做基。关于这一点，我们下面给出一个例子。
我们考虑的不一定是向量空间，也有可能是函数空间，换句话说， $v_1,v_2,...,v_n$ ， $w_1,w_2,...,w_m$ 可以不是向量，而可以是一些基础函数。在本文的末尾，我们会给出一个相应的例子。

Example 5 (Projection): 考虑线性变换 $\mathbb{R}^2\to\mathbb{R}^2$ 把平面上任意向量投影到 $y = x$ 这条直线上，求 $T\bm{T}$ 的矩阵形式。

求矩阵型知识浅，我们得先确定一组基。

1）首先，我们选取 basis $v1=w1=[1,0]⊤v_1=w_1=[1,0]^\top$ , $v2=w2=[0,1]⊤v_2=w_2=[0,1]^\top$ . 这是一组最方便的basis。此时，我们有
$12]⊤=12w1+12w2T(v_1)=\left[\frac{1}{2},~\frac{1}{2}\right]^\top=\frac{1}{2}w_1+\frac{1}{2}w_2$

$12]⊤=12w1+12w2T(v_2)=\left[\frac{1}{2},~\frac{1}{2}\right]^\top=\frac{1}{2}w_1+\frac{1}{2}w_2$

因此 $T$ 在选取的 basis 下的矩阵为
$A=[12121212]\bm{A}=\begin{bmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} \\ \end{bmatrix}$

2）我们也可以选取 basis $v1=w1=[12,12]⊤v_1=w_1=[\frac{1}{2},\frac{1}{2}]^\top$ , $v2=w2=[−12,12]⊤v_2=w_2=[-\frac{1}{2},\frac{1}{2}]^\top$ . 即，”顺着 $y = x$ 的方向“ 和 ”与 $y = x$ 垂直的方向“。此时，我们有
$12]⊤=w1+0w2T(v_1)=\left[\frac{1}{2},~\frac{1}{2}\right]^\top= w_1+0w_2$

$12]⊤=0w1+0w2T(v_2)=\left[-\frac{1}{2},~\frac{1}{2}\right]^\top=0w_1+0w_2$

因此 $T$ 在选取的 basis 下的矩阵为
$A=[1000]\bm{A}=\begin{bmatrix} 1 & 0 \\ 0 & 0 \\ \end{bmatrix}$

实际上，如果我们把第一组基下得到的 $A\bm{A}$ 特征值分解
$A=[12121212]=12[1−111][1000]12[11−11]\bm{A}=\begin{bmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} \\ \end{bmatrix}=\frac{1}{\sqrt{2}}\begin{bmatrix} 1 & -1 \\ 1 & 1 \\ \end{bmatrix} \begin{bmatrix} 1 & 0 \\ 0 & 0 \\ \end{bmatrix}\frac{1}{\sqrt{2}}\begin{bmatrix} 1 & 1 \\ -1 & 1 \\ \end{bmatrix}$

可以看到，实际上我们第二组基选取的就是特征值的方向，此时得到的矩阵是对角阵，其实就是特征值分解的结果。

Example 6 (basis of function): 好，最后我们再看一个以函数作为basis的例子。考虑变换 $T(f(x))=dfdxT(f(x))=\frac{df}{dx}$ , 求导实际上是一个线性变换，只要我们有了一些基本函数的求导公式，就能把这些函数作为基，把他们线性组合的导求出来。比如，我们把输入的 basis 选为 ${1,x,x^2\}$ ,输出的 basis 选为 ${1,x\}$ ，那么，给定输入
$[c1,c2,c3]⊤=c1+c2x+c3x2[c_1,c_2,c_3]^\top=c_1 +c_2x+c_3x^2$