小结
- 矩阵变化的定义
- 线性变化的定义
矩阵方程Ax=b\boldsymbol{Ax}=\boldsymbol{b}Ax=b和对应的向量方程x1a1+⋯+xnan=bx_1\boldsymbol{a_1}+\cdots+x_n\boldsymbol{a_n}=\boldsymbol{b}x1a1+⋯+xnan=b之间的差别仅仅是记号上的不同。然而矩阵方程Ax=b\boldsymbol{Ax}=\boldsymbol{b}Ax=b出现在线性代数和应用中并不仅仅是直接与向量的线性组合问题有关。通常的情况是把矩阵A\boldsymbol{A}A当作一个对象,它通过乘法“作用”于向量x\boldsymbol{x}x,产生新的向量称为Ax\boldsymbol{Ax}Ax。
[4−3132051][1111]=[58][4−3132051][14−13]=[00]\begin{bmatrix}4 & -3 & 1 & 3 \\
2 & 0 & 5 & 1\end{bmatrix}\begin{bmatrix}1 \\ 1 \\ 1 \\ 1\end{bmatrix}=\begin{bmatrix}5 \\ 8\end{bmatrix} \\ \begin{bmatrix}4 & -3 & 1 & 3 \\
2 & 0 & 5 & 1\end{bmatrix}\begin{bmatrix}1 \\ 4 \\ -1 \\ 3\end{bmatrix}=\begin{bmatrix}0 \\ 0\end{bmatrix}[42−301531]⎣⎢⎢⎡1111⎦⎥⎥⎤=[58][42−301531]⎣⎢⎢⎡14−13⎦⎥⎥⎤=[00]
由这个新观点,若A=[4−3132051]\boldsymbol{A}=\begin{bmatrix}4 & -3 & 1 & 3 \\
2 & 0 & 5 & 1\end{bmatrix}A=[42−301531],解方程Ax=b\boldsymbol{Ax}=\boldsymbol{b}Ax=b可解释为:求出R4\mathbb{R}^{4}R4中所有经过乘以A\boldsymbol{A}A的“作用”后变成为R2\mathbb{R}^{2}R2中b\boldsymbol{b}b的向量x\boldsymbol{x}x。
由x\boldsymbol{x}x到Ax\boldsymbol{Ax}Ax的对应是由一个向量集到另一个向量集的函数。这个概念推广了通常的函数概念,通常的函数是把一个实数变为另一个实数的规则。
由Rn\mathbb{R}^{n}Rn到Rm\mathbb{R}^{m}Rm的一个变换(或函数、映射)T\boldsymbol{T}T是一个规则,它把Rn\mathbb{R}^{n}Rn中每个向量x\boldsymbol{x}x对应以Rm\mathbb{R}^{m}Rm中一个向量T(x)\boldsymbol{T(x)}T(x)。集Rn\mathbb{R}^{n}Rn称为T\boldsymbol{T}T的定义域,而Rm\mathbb{R}^{m}Rm称为T\boldsymbol{T}T的余定义域(或取值空间).符号T\boldsymbol{T}T:Rn→Rm\mathbb{R}^{n}\rightarrow\mathbb{R}^{m}Rn→Rm说明T\boldsymbol{T}T的定义域是Rn\mathbb{R}^{n}Rn而余定义域是Rm\mathbb{R}^{m}Rm。对于Rn\mathbb{R}^{n}Rn中向量x\boldsymbol{x}x,Rm\mathbb{R}^{m}Rm中向量T(x)\boldsymbol{T(x)}T(x)称为x\boldsymbol{x}x(在T\boldsymbol{T}T作用下)的像。所有像T(x)\boldsymbol{T(x)}T(x)的集合称为T\boldsymbol{T}T的值域。
矩阵变换
对Rn\mathbb{R}^{n}Rn中每个x\boldsymbol{x}x,T(x)\boldsymbol{T(x)}T(x)由Ax\boldsymbol{Ax}Ax计算得到,其中A\boldsymbol{A}A是m×nm \times nm×n矩阵。为简单起见,有时将这样一个矩阵变换记为x↦Ax\boldsymbol{x}\mapsto\boldsymbol{Ax}x↦Ax。注意当A\boldsymbol{A}A有nnn列时,T\boldsymbol{T}T的定义域为Rn\mathbb{R}^{n}Rn,而当A\boldsymbol{A}A的每个列有mmm个元素时,T\boldsymbol{T}T的余定义域为Rm\mathbb{R}^{m}Rm。T\boldsymbol{T}T的值域为A\boldsymbol{A}A的列的所有线性组合的集合,因为每个像T(x)\boldsymbol{T(x)}T(x)有Ax\boldsymbol{Ax}Ax的形式。
设A=[1−335−17],u=[2−1],b=[325],c=[32−5]\boldsymbol{A}=\begin{bmatrix}1 & -3 \\ 3 & 5 \\ -1 & 7\end{bmatrix},\boldsymbol{u}=\begin{bmatrix}2 \\ -1\end{bmatrix},\boldsymbol{b}=\begin{bmatrix}3 \\ 2 \\ 5\end{bmatrix},\boldsymbol{c}=\begin{bmatrix}3 \\ 2 \\ -5\end{bmatrix}A=⎣⎡13−1−357⎦⎤,u=[2−1],b=⎣⎡325⎦⎤,c=⎣⎡32−5⎦⎤,定义变换T\boldsymbol{T}T:R2→R3\mathbb{R}^{2}\rightarrow\mathbb{R}^{3}R2→R3为T(x)=Ax\boldsymbol{T(x)}=\boldsymbol{Ax}T(x)=Ax,于是
T(x)=Ax=[1−335−17][x1x2]=[x1−3x23x1+5x2−x1+7x2]\boldsymbol{T(x)}=\boldsymbol{Ax}=\begin{bmatrix}1 & -3 \\ 3 & 5 \\ -1 & 7\end{bmatrix}\begin{bmatrix}x_1 \\ x_2\end{bmatrix}=\begin{bmatrix}x_1-3x_2 \\ 3x_1+5x_2 \\ -x_1+7x_2\end{bmatrix}T(x)=Ax=⎣⎡13−1−357⎦⎤[x1x2]=⎣⎡x1−3x23x1+5x2−x1+7x2⎦⎤
- 求u\boldsymbol{u}u在变换T\boldsymbol{T}T下的像T(u)\boldsymbol{T(u)}T(u)
- 求R2\mathbb{R}^{2}R2中的向量x\boldsymbol{x}x,使x\boldsymbol{x}x在T\boldsymbol{T}T下的像是向量b\boldsymbol{b}b
- 是否有其他向量在T\boldsymbol{T}T下的像是向量b\boldsymbol{b}b?
- 确定c\boldsymbol{c}c是否属于变换T\boldsymbol{T}T的值域
解:- T(u)=[1−335−17][2−1]=[51−9]\boldsymbol{T(u)}=\begin{bmatrix}1 & -3 \\ 3 & 5 \\ -1 & 7\end{bmatrix}\begin{bmatrix}2 \\ -1\end{bmatrix} =\begin{bmatrix}5 \\ 1 \\ -9 \end{bmatrix}T(u)=⎣⎡13−1−357⎦⎤[2−1]=⎣⎡51−9⎦⎤
- 解T(x)=b\boldsymbol{T(x)}=\boldsymbol{b}T(x)=b,即解Ax=b\boldsymbol{Ax}= \boldsymbol{b}Ax=b。
将增广矩阵进行行化简:
[1−33352−17−5]\begin{bmatrix}1 & -3 & 3 \\ 3 & 5 & 2 \\ -1 & 7 & -5\end{bmatrix}⎣⎡13−1−35732−5⎦⎤~[1−33014−704−2]\begin{bmatrix}1 & -3 & 3 \\ 0 & 14 & -7 \\ 0 & 4 & -2\end{bmatrix}⎣⎡100−31443−7−2⎦⎤~[1−3301−0.5000]\begin{bmatrix}1 & -3 & 3 \\ 0 & 1 & -0.5 \\ 0 & 0 & 0 \end{bmatrix}⎣⎡100−3103−0.50⎦⎤
因此,x1=1.5,x2=0.5x_1=1.5,x_2=0.5x1=1.5,x2=0.5。即x=[1.5−0.5]\boldsymbol{x} = \begin{bmatrix} 1.5 \\ -0.5 \end{bmatrix}x=[1.5−0.5]在T\boldsymbol{T}T下的像是给定的向量b\boldsymbol{b}b - 由2)可知,Ax=b\boldsymbol{Ax}= \boldsymbol{b}Ax=b的解是唯一的。所有仅有一个x\boldsymbol{x}x使它的像是b\boldsymbol{b}b。
- 若向量c\boldsymbol{c}c是R2\mathbb{R}^{2}R2中某个x\boldsymbol{x}x在T\boldsymbol{T}T下的像,则需要有x\boldsymbol{x}x,使方程Ax=c\boldsymbol{Ax}=\boldsymbol{c}Ax=c有解。将Ax=c\boldsymbol{Ax}=\boldsymbol{c}Ax=c的增广矩阵进行行化简:
[1−33352−175]\begin{bmatrix} 1 & -3 & 3 \\ 3 & 5 & 2 \\ -1 & 7 & 5 \end{bmatrix}⎣⎡13−1−357325⎦⎤~[1−33014−7048]\begin{bmatrix}1 & -3 & 3 \\ 0 & 14 & -7 \\ 0 & 4 & 8\end{bmatrix}⎣⎡100−31443−78⎦⎤~[1−33012014−7]\begin{bmatrix}1 & -3 & 3 \\ 0 & 1 & 2 \\ 0 & 14 & -7\end{bmatrix}⎣⎡100−311432−7⎦⎤~[1−3301200−35]\begin{bmatrix}1 & -3 & 3 \\ 0 & 1 & 2 \\ 0 & 0 & -35 \end{bmatrix}⎣⎡100−31032−35⎦⎤
第三个方程是0=-35,说明方程无解。因此c\boldsymbol{c}c不属于T\boldsymbol{T}T的值域。
若A=[100010000]\boldsymbol{A}=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{bmatrix}A=⎣⎡100010000⎦⎤,则变换x↦Ax\boldsymbol{x}\mapsto\boldsymbol{Ax}x↦Ax是把R3\mathbb{R}^{3}R3中的点投影到x1x2x_1x_2x1x2坐标平面上,因为x↦Ax=[100010000][x1x2x3]=[x1x20]\boldsymbol{x}\mapsto\boldsymbol{Ax}=\begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{bmatrix}\begin{bmatrix} x_1 \\ x_2 \\ x_3\end{bmatrix}=\begin{bmatrix}x_1 \\ x_2 \\ 0\end{bmatrix}x↦Ax=⎣⎡100010000⎦⎤⎣⎡x1x2x3⎦⎤=⎣⎡x1x20⎦⎤
若A=[1031]\boldsymbol{A}=\begin{bmatrix} 1 & 0 \\ 3 & 1 \end{bmatrix}A=[1301],变换T:R2→R2\boldsymbol{T}:\mathbb{R}^{2}\rightarrow\mathbb{R}^{2}T:R2→R2定义为Tx=Ax\boldsymbol{Tx}=\boldsymbol{Ax}Tx=Ax,称为剪切变换。可以说明,若T\boldsymbol{T}T作用一个正方形的各点,则像的集构成带阴影的平行四边形。关键的思想是证明T\boldsymbol{T}T将线段映射称为线段,然后验证正方形的4个顶点映射成平行四边形的4个顶点。
线性变换
定义 变换(或映射)T\boldsymbol{T}T称为线性的,若
- 对T\boldsymbol{T}T的定义域中一切u,v\boldsymbol{u,v}u,v,T(u+v)=T(u)+T(v)\boldsymbol{T(u}+\boldsymbol{v)}=\boldsymbol{T(u)} + \boldsymbol{T(v)}T(u+v)=T(u)+T(v)
- 对T\boldsymbol{T}T的定义域中一切u\boldsymbol{u}u和数ccc,T(cu)=cT(u)\boldsymbol{T(}c\boldsymbol{u)}=c\boldsymbol{T(u)}T(cu)=cT(u)。
线性变换保持向量的加法运算与标量乘法运算。
若T\boldsymbol{T}T是线性变换,则T(0)=0\boldsymbol{T(0)}=\boldsymbol{0}T(0)=0,且对T\boldsymbol{T}T的定义域中一切向量u\boldsymbol{u}u和v\boldsymbol{v}v以及数ccc和ddd有:T(cu+dv)=cT(u)+dT(v)\boldsymbol{T(}c\boldsymbol{u} + d\boldsymbol{v)}=c\boldsymbol{T(u)}+d\boldsymbol{T(v)}T(cu+dv)=cT(u)+dT(v)。
对所有u,v\boldsymbol{u},\boldsymbol{v}u,v和c,dc,dc,d,若一个变换满足T(cu+dv)=cT(u)+dT(v)\boldsymbol{T(}c\boldsymbol{u} + d\boldsymbol{v)}=c\boldsymbol{T(u)}+d\boldsymbol{T(v)}T(cu+dv)=cT(u)+dT(v),该变换必是线性的。
(若c=d=1c=d=1c=d=1,可满足定义条件1;若c=1,d=0c=1,d=0c=1,d=0,可满足定义条件2。)
重复应用T(cu+dv)=cT(u)+dT(v)\boldsymbol{T(}c\boldsymbol{u} + d\boldsymbol{v)}=c\boldsymbol{T(u)}+d\boldsymbol{T(v)}T(cu+dv)=cT(u)+dT(v),得出推广:T(c1v1+⋯+cpvp)=c1T(v1)+⋯+cpT(vp)\boldsymbol{T(}c_1\boldsymbol{v_1} + \cdots + c_p\boldsymbol{v_p)}=c_1\boldsymbol{T(v_1)}+\cdots+ c_p\boldsymbol{T(v_p)}T(c1v1+⋯+cpvp)=c1T(v1)+⋯+cpT(vp)。该推广等式,在工程和物理中,称为叠加原理。
给定数rrr,定义T:R2→R2\boldsymbol{T}:\mathbb{R}^{2}\rightarrow\mathbb{R}^{2}T:R2→R2为T(x)=rx\boldsymbol{T(x)}=r\boldsymbol{x}T(x)=rx,当0≤r≤10 \leq r \leq 10≤r≤1时,T\boldsymbol{T}T称为压缩变换;当r≥1r \geq 1r≥1时,T\boldsymbol{T}T称为拉伸变换。设r=3r = 3r=3,证明T\boldsymbol{T}T是线性变换。
解:设u,v\boldsymbol{u,v}u,v属于R2\mathbb{R}^{2}R2,c,dc,dc,d为数,则
T(cu+dv)=3(cu+dv)=3cu+3dv=c(3u)+d(3v)=cT(u)+dT(v)\quad\boldsymbol{T(}c\boldsymbol{u} + d\boldsymbol{v)} \\
= 3(c\boldsymbol{u} + d\boldsymbol{v}) \\
= 3c\boldsymbol{u} + 3d\boldsymbol{v} \\
= c(3\boldsymbol{u}) + d(3\boldsymbol{v})\\
= c\boldsymbol{T(u)}+d\boldsymbol{T(v)}T(cu+dv)=3(cu+dv)=3cu+3dv=c(3u)+d(3v)=cT(u)+dT(v)
因满足T(cu+dv)=cT(u)+dT(v)\boldsymbol{T(}c\boldsymbol{u} + d\boldsymbol{v)}=c\boldsymbol{T(u)}+d\boldsymbol{T(v)}T(cu+dv)=cT(u)+dT(v),故此变换必是线性的。
其实可以猜出矩阵A=[r00r]\boldsymbol{A}=\begin{bmatrix}
r & 0 \\ 0 & r\end{bmatrix}A=[r00r]。