MIT 线性代数 Linear Algebra 30:线性变换和其矩阵形式

本文介绍了线性变换的基本概念及其矩阵表示方法,并通过实例详细解释了如何选择不同的基来表达线性变换。

在这一节的开始,让我们先短暂忘记矩阵,研究什么是线性变换。实际上,线性变换是比矩阵更 general 的定义。只不过在 linear algebra 中我们用矩阵来分析线性变换。

线性变换

满足以下两个条件的变换 TTT 我们称为线性变换
T(v+w)=T(v)+T(W)T(v+w)=T(v)+T(W)T(v+w)=T(v)+T(W)

T(cv)=cT(v)T(cv)=cT(v)T(cv)=cT(v)

可以看到,线性变换实际上就是一个线性函数:输入线性组合的输出等于输出的线性组合。

Fact 1: T(0)=0T(0) = 0T(0)=0.


Example 1 (Projection): 投影是一种线性变换,比如我们考虑把空间中任意一个向量投影到地平线上,这个变换是线性的。

Example 2 (Rotation): 旋转也是一个线性变换,毕竟叠加后旋转还是旋转后叠加,效果是一样的。

Non-example 3 (Shifting the whole plane): 平移整个平面 (即把所有vector加一个constant vector d\bm{d}d) 并不是线性变换.
下图很清晰可以看出,而且 T(0)=0T(0) = 0T(0)=0 首先就不满足。

在这里插入图片描述
Non-example 4 (length): 取一个向量的长度 T(v)=∥v∥T(\bm{v})=\|\bm{v}\|T(v)=v 并不是线性变换。

这个变换 T:Rn→RT:\mathbb{R}^n\to\mathbb{R}T:RnR, 但显然他不是线性变换因为 T(−v)≠−T(v)T(-\bm{v})\neq -T(\bm{v})T(v)=T(v).


Fact 2: Matrix A\bm{A}A 是一种线性变换.

A(cv+dw)=cAv+dAw\bm{A}(c\bm{v}+d\bm{w})=c\bm{A}\bm{v}+d\bm{A}\bm{w}A(cv+dw)=cAv+dAw

Fact 3: 对于任意一个线性变换 TTT, 如果我们选取了一组基 v1,v2,...,vnv_1,v_2,...,v_nv1,v2,...,vn 来表示任意的输入,选取一组基 w1,w2,...,wmw_1,w_2,...,w_mw1,w2,...,wm 来表示任意的输出,那么线性变换 TTT 总能写成在这两组基下的矩阵形式

线性变换的矩阵表示

如果输入基 v1,v2,...,vn\bm{v_1},\bm{v_2},...,\bm{v_n}v1,v2,...,vn,输出基 w1,w2,...,wm\bm{w_1},\bm{w_2},...,\bm{w_m}w1,w2,...,wm 均已选取。我们怎么确定线性组合的矩阵形式尼?

其实很简单,我们只需要选取基变换坐标作为矩阵的每个entry即可,请看
T(v1)=a11w1+a21w2+...+am1wmT(\bm{v_1})=a_{11} \bm{w_1} + a_{21}\bm{ w_2} + ... + a_{m1} \bm{w_m}T(v1)=a11w1+a21w2+...+am1wm

T(v2)=a12w1+a22w2+...+am2wmT(\bm{v_2})=a_{12}\bm{ w_1} + a_{22} \bm{w_2} + ... + a_{m2} \bm{w_m}T(v2)=a12w1+a22w2+...+am2wm

.........

T(vm)=a1nw1+a2nw2+...+amnwmT(\bm{v_m})=a_{1n} \bm{w_1} + a_{2n} \bm{w_2} + ... + a_{mn} \bm{w_m}T(vm)=a1nw1+a2nw2+...+amnwm

其中 amna_{mn}amn 即为基变换坐标的每个 entry。对于任意一个输入 v\bm{v}v,它在 {v1,v2,...,vn}\{\bm{v_1},\bm{v_2},...,\bm{v_n}\}{v1,v2,...,vn} 有一个坐标,如果我们把矩阵写成基的坐标,那么他经过线性变换后得到的刚刚好是输出 T(v)T(\bm{v})T(v){w1,w2,...,wm}\{\bm{w_1},\bm{w_2},...,\bm{w_m}\}{w1,w2,...,wm} 下的坐标。矩阵形式可以写为

T(V)=WAT(\bm{V})=\bm{WA}T(V)=WA

Remark:

  1. 一般我们默认的极坐标是 单位阵的各个column,但实际上我们可以选取任意线性独立的vector在做基。关于这一点,我们下面给出一个例子。
  2. 我们考虑的不一定是向量空间,也有可能是函数空间,换句话说,v1,v2,...,vnv_1,v_2,...,v_nv1,v2,...,vnw1,w2,...,wmw_1,w_2,...,w_mw1,w2,...,wm 可以不是向量,而可以是一些基础函数。在本文的末尾,我们会给出一个相应的例子。

Example 5 (Projection): 考虑线性变换 T:R2→R2T: \mathbb{R}^2\to\mathbb{R}^2T:R2R2 把平面上任意向量投影到 y=xy=xy=x 这条直线上,求 T\bm{T}T 的矩阵形式。

求矩阵型知识浅,我们得先确定一组基。

1)首先,我们选取 basis v1=w1=[1,0]⊤v_1=w_1=[1,0]^\topv1=w1=[1,0], v2=w2=[0,1]⊤v_2=w_2=[0,1]^\topv2=w2=[0,1]. 这是一组最方便的basis。此时,我们有
T(v1)=[12, 12]⊤=12w1+12w2T(v_1)=\left[\frac{1}{2},~\frac{1}{2}\right]^\top=\frac{1}{2}w_1+\frac{1}{2}w_2T(v1)=[21, 21]=21w1+21w2

T(v2)=[12, 12]⊤=12w1+12w2T(v_2)=\left[\frac{1}{2},~\frac{1}{2}\right]^\top=\frac{1}{2}w_1+\frac{1}{2}w_2T(v2)=[21, 21]=21w1+21w2

因此 TTT 在选取的 basis 下的矩阵为
A=[12121212]\bm{A}=\begin{bmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} \\ \end{bmatrix}A=[21212121]

2)我们也可以选取 basis v1=w1=[12,12]⊤v_1=w_1=[\frac{1}{2},\frac{1}{2}]^\topv1=w1=[21,21], v2=w2=[−12,12]⊤v_2=w_2=[-\frac{1}{2},\frac{1}{2}]^\topv2=w2=[21,21]. 即,”顺着 y=xy=xy=x 的方向“ 和 ”与 y=xy=xy=x 垂直的方向“。此时,我们有
T(v1)=[12, 12]⊤=w1+0w2T(v_1)=\left[\frac{1}{2},~\frac{1}{2}\right]^\top= w_1+0w_2T(v1)=[21, 21]=w1+0w2

T(v2)=[−12, 12]⊤=0w1+0w2T(v_2)=\left[-\frac{1}{2},~\frac{1}{2}\right]^\top=0w_1+0w_2T(v2)=[21, 21]=0w1+0w2

因此 TTT 在选取的 basis 下的矩阵为
A=[1000]\bm{A}=\begin{bmatrix} 1 & 0 \\ 0 & 0 \\ \end{bmatrix}A=[1000]

实际上,如果我们把第一组基下得到的 A\bm{A}A 特征值分解
A=[12121212]=12[1−111][1000]12[11−11]\bm{A}=\begin{bmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} \\ \end{bmatrix}=\frac{1}{\sqrt{2}}\begin{bmatrix} 1 & -1 \\ 1 & 1 \\ \end{bmatrix} \begin{bmatrix} 1 & 0 \\ 0 & 0 \\ \end{bmatrix}\frac{1}{\sqrt{2}}\begin{bmatrix} 1 & 1 \\ -1 & 1 \\ \end{bmatrix}A=[21212121]=21[1111][1000]21[1111]

可以看到,实际上我们第二组基选取的就是特征值的方向,此时得到的矩阵是对角阵,其实就是特征值分解的结果。


Example 6 (basis of function): 好,最后我们再看一个以函数作为basis的例子。考虑变换 T(f(x))=dfdxT(f(x))=\frac{df}{dx}T(f(x))=dxdf, 求导实际上是一个线性变换,只要我们有了一些基本函数的求导公式,就能把这些函数作为基,把他们线性组合的导求出来。比如,我们把输入的 basis 选为 {1,x,x2}\{1,x,x^2\}{1,x,x2},输出的 basis 选为 {1,x}\{1,x\}{1,x},那么,给定输入
[c1,c2,c3]⊤=c1+c2x+c3x2[c_1,c_2,c_3]^\top=c_1 +c_2x+c_3x^2[c1,c2,c3]=c1+c2x+c3x2

我们可以得到输出
T(c1+c2x+c3x2)=c2+2c3x=[c2,2c3]⊤T(c_1 +c_2x+c_3x^2)=c_2 + 2c_3 x=[c_2,2c_3]^\topT(c1+c2x+c3x2)=c2+2c3x=[c2,2c3]

因此,TTT 的矩阵形式可以写为
A=[010002]\bm{A}=\begin{bmatrix} 0 & 1 & 0 \\ 0 & 0 & 2 \\ \end{bmatrix}A=[001002]

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值