这一节是关于子空间的真实大小。对于 m×nm\times nm×n 的矩阵,它有 nnn 个列,但是它真正的维数不一定为 nnn,维数可以由无关列的个数来得到。列空间的实际维度就是秩 rrr。
无关的概念是用于向量空间中的任意向量 v1,...,vn\boldsymbol v_1,...,\boldsymbol v_nv1,...,vn。这一节主要关注的是常用的子空间 —— 尤其是矩阵 AAA 的列空间和零空间。“向量” 其实不一定是列向量,也可以是矩阵或函数;它们可以线性无关(或线性相关)。
对于基的理解:无关向量张成空间。
空间中的每一个向量都是基向量的唯一组合\pmb{空间中的每一个向量都是基向量的唯一组合}空间中的每一个向量都是基向量的唯一组合本节有四个重点:
1、无关向量 \kern 24pt(没有额外向量)
2、张成一个空间\kern 10pt(足够的能生成余下的向量的向量)
3、空间的基 \kern 24pt(不多也不少)
4、空间的维度\kern 18pt(基的向量个数)
一、线性无关
定义 \kern 10pt当 Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 的解唯一解是 x=0\boldsymbol x=\boldsymbol 0x=0 时,AAA 的列是线性无关的。没有其它的组合使得 AxA\boldsymbol xAx 是零向量。
当零空间 N(A)\pmb N(A)N(A) 只有一个零向量时,AAA 的列线性无关。下面一 R3\pmb {\textrm R}^3R3 为例解释线性无关(和相关):
- 如果三个向量不在同一个平面内,则它们是无关的。除了 0v1+0v2+0v30\boldsymbol v_1+0\boldsymbol v_2+0\boldsymbol v_30v1+0v2+0v3 之外,不存在其它 v1,v2,v3\boldsymbol v_1,\boldsymbol v_2,\boldsymbol v_3v1,v2,v3 的组合可以得到零向量。如 Figure 3.4 所示:
- 如果三个向量 w1,w2,w3\boldsymbol w_1,\boldsymbol w_2,\boldsymbol w_3w1,w2,w3 在同一平面,则它们相关。

将无关的概念用在 121212 维空间中的 777 个向量,如果它们都是 AAA 的列且是无关的,那么零空间就只有 x=0\boldsymbol x=\boldsymbol 0x=0,没有任何一个向量是其它六个向量的组合。
换个表述方式,就是线性无关的第 222 定义,该定义会用在任意向量空间中的任意向量序列。当向量是 AAA 的列时,这两种定义完全相同。
定义 \kern 10pt 如果 0v1+0v2+⋯+0vn0\boldsymbol v_1+0\boldsymbol v_2+\cdots+0\boldsymbol v_n0v1+0v2+⋯+0vn 是得到零向量的唯一组合,则向量序列 v1,v2,⋯ ,vn\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_nv1,v2,⋯,vn 线性无关。
线性无关x1v1+x2v1+⋯+xnvn=0仅当所有 x′s 都为 0 时成立(3.4.1)\pmb{线性无关}\\x_1\boldsymbol v_1+x_2\boldsymbol v_1+\cdots +x_n\boldsymbol v_n=\boldsymbol 0\kern 10pt仅当所有\,x's\,都为\,0\,时成立\kern 10pt(3.4.1)线性无关x1v1+x2v1+⋯+xnvn=0仅当所有x′s都为0时成立(3.4.1)
若存在一个 x′sx'sx′s 不全为 000 的组合可以得到 0\boldsymbol 00,这个向量序列是相关的。
正确的表述方式:向量序列是线性无关的。可以简述为:向量是无关的。错误的表述方式:矩阵是无关的。
一个向量序列要么相关,要么无关,它们的组合可以得到零向量(x′sx'sx′s 不全为零)或不能得到。所以关键问题是:什么样的组合可以得到零向量?下面是 R2\pmb{\textrm R}^2R2 中的一些例子:
(a)向量 (1,0)(1,0)(1,0) 和 (0,1)(0,1)(0,1) 是无关的。
(b)向量 (1,0)(1,0)(1,0) 和 (1,0.00001)(1,0.00001)(1,0.00001) 是无关的。
(c)向量 (1,1)(1,1)(1,1) 和 (−1,−1)(-1,-1)(−1,−1) 是相关的。
(d)向量 (1,1)(1,1)(1,1) 和 (0,0)(0,0)(0,0) 是相关的,这是因为零向量。
(e)在 R2\textrm{\pmb R}^2R2 中,任意三个向量 (a,b),(c,d),(e,f)(a,b),(c,d),(e,f)(a,b),(c,d),(e,f) 都是相关的。
从几何上看,(1,1)(1,1)(1,1) 和 (−1,−1)(-1,-1)(−1,−1) 都在同一条通过原点的直线上,它们是相关的。使用定义来看,找到 x1x_1x1 和 x2x_2x2 的一个组合,使得 x1(1,1)+x2(−1,−1)=(0,0)x_1(1,1)+x_2(-1,-1)=(0,0)x1(1,1)+x2(−1,−1)=(0,0),同求解 Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 是一样的:[1−11−1][x1x2]=[00]解得 x1=1,x2=1\begin{bmatrix}1&-1\\1&-1\end{bmatrix}\begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}0\\0\end{bmatrix}\kern 10pt解得\,x_1=1,x_2=1[11−1−1][x1x2]=[00]解得x1=1,x2=1AAA 的列是相关的,因为它的零空间中存在非零向量。
如果 v′s\boldsymbol v'sv′s 中的一个向量是零向量,则该向量组一定是线性相关的。
R2\textrm {\pmb R}^2R2 中的三个向量不可能线性无关!一种解释是:矩阵 AAA 的三个列则必定存在一个自由变量,那么 Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 就有一个特殊解。另一种解释是:如果前两个向量是无关的,那么它们的某种组合肯定能得到第三个向量。
下面是 R3\pmb {\textrm R}^3R3 空间中的三个向量,如果其中一个是另一个的倍数,则它们相关。但是完整的测试应该三个向量一起,我们将这三个向量放在一个矩阵中,然后求解 Ax=0A\boldsymbol x=\boldsymbol 0Ax=0。
【例1】AAA 的列是相关的,Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 有一个非零解:Ax=[103215103][−311]是−3[121]+1[010]+1[353]=[000]A\boldsymbol x=\begin{bmatrix}1&0&3\\2&1&5\\1&0&3\end{bmatrix}\begin{bmatrix}-3\\\kern 7pt1\\\kern 7pt1\end{bmatrix}是\kern 3pt-3\begin{bmatrix}1\\2\\1\end{bmatrix}+1\begin{bmatrix}0\\1\\0\end{bmatrix}+1\begin{bmatrix}3\\5\\3\end{bmatrix}=\begin{bmatrix}0\\0\\0\end{bmatrix}Ax=121010353−311是−3121+1010+1353=000这个矩阵的秩只有 r=2r=2r=2。无关列会得到列满秩 r=n=3r=n=3r=n=3。
这个矩阵中行同样也是相关的,行 111 减去行 333 会得到零行。对于方阵,可以证明相关列则有相关行,反之亦然。
问题: 如何求解 Ax=0A\boldsymbol x=\boldsymbol 0Ax=0?系统的方法是消元法。A=[103215103]简化得R=[10301−1000]A=\begin{bmatrix}1&0&3\\2&1&5\\1&0&3\end{bmatrix}简化得\kern 3ptR=\begin{bmatrix}1&0&\kern 7pt3\\0&1&-1\\0&0&\kern 7pt0\end{bmatrix}A=121010353简化得R=1000103−10解 x=(−3,1,0)\boldsymbol x=(-3,1,0)x=(−3,1,0) 正好就是特殊解。这个说明自由列(列 333)是主元列的组合,这种情况下不可能无关。
列满秩 \kern 10pt当 AAA 的秩 r=nr=nr=n 时,它的列是无关的。此时有 nnn 个主元没有自由变量。零空间中仅有 x=0\boldsymbol x=\boldsymbol 0x=0。
有一种情形很重要。假设 AAA 有 777 列,每列有 555 个分量(m=5m=5m=5 小于 n=7n=7n=7),则它的列肯定是相关的。R5\pmb{\textrm R}^5R5 中任意的 777 个向量都是相关的,AAA 的秩不可能大于 555,555 个行不可能超过 555 个主元。Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 至少有 7−5=27-5=27−5=2 个自由变量,因此它有非零解 —— 这有意味着 AAA 的列是相关的。
如果 n>mn>mn>m,则 Rm\pmb{\textrm R}^mRm 中的任意 nnn 个向量都是相关的。
这种类型的矩阵列比行多,它既矮又宽。如果 n>mn>mn>m,则这些列必然相关,因为 Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 有非零解。
如果 n≤mn\leq mn≤m,则这些列可能相关也可能无关,消元可以得到 rrr 个主元列,这 rrr 个主元列是无关列。
注: 另一种描述无关的方法是:一个向量是其它向量的组合。这种描述方法非常简洁,但是我们并没有使用这种定义。我们定义比较长:除了每个系数 xxx 都是零的平凡组合外,存在某个组合可能得到零向量。这种定义方式排除了简单得到零向量的可能,如果一个向量是其它向量的组合,这个向量的系数是 x=1x=1x=1,这种情况下该向量特殊化了。
这个问题的重点是,我们的定义没有选择一个特定的向量,AAA 的每一列都是同等对待的。当我们检验 Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 时,他可能有非零解也可能没有,而这样比去检验最后一列(或第一列,或中间的某一列)是不是其它列的组合要好一些。
二、向量张成子空间
对于列空间,从列 v1,⋯ ,vn\boldsymbol v_1,\cdots,\boldsymbol v_nv1,⋯,vn 开始,子空间被所有的组合 x1v1+⋯+xnvnx_1\boldsymbol v_1+\cdots+x_n\boldsymbol v_nx1v1+⋯+xnvn 所填满,即列空间包含 AxA\boldsymbol xAx 的所有组合。关于张成(span)的描述:列空间是由列向量张成的。
定义 \kern 10pt若一个向量组的线性组合填满一个空间,则该向量组张成这个空间。
矩阵的列张成列空间,它们可能是相关的。\pmb{矩阵的列张成列空间,它们可能是相关的。}矩阵的列张成列空间,它们可能是相关的。【例2】v1=[10]\boldsymbol v_1=\begin{bmatrix}1\\0\end{bmatrix}v1=[10] 和 v2=[01]\boldsymbol v_2=\begin{bmatrix}0\\1\end{bmatrix}v2=[01] 张成整个二维空间 R2\pmb{\textrm R}^2R2。
【例3】v1=[10],v2=[01],v3=[47]\boldsymbol v_1=\begin{bmatrix}1\\0\end{bmatrix},\boldsymbol v_2=\begin{bmatrix}0\\1\end{bmatrix},\boldsymbol v_3=\begin{bmatrix}4\\7\end{bmatrix}v1=[10],v2=[01],v3=[47] 也张成整个二维空间 R2\pmb{\textrm R}^2R2。
【例4】w1=[11]\boldsymbol w_1=\begin{bmatrix}1\\1\end{bmatrix}w1=[11] 和 w2=[−1−1]\boldsymbol w_2=\begin{bmatrix}-1\\-1\end{bmatrix}w2=[−1−1] 只张成 R2\pmb{\textrm R^2}R2 中的一条直线,w1\boldsymbol w_1w1 这一个向量也可以。
考虑两个三维空间中从 (0,0,0)(0,0,0)(0,0,0) 出发的向量,一般来说它们可以张成一个平面,它们的线性组合可以得到这个平面。在数学上,还有其它的可能性:两个向量可以张成一条直线,三个向量可以张成整个 R3\textrm {\pmb R}^3R3,或者一个平面,甚至它们可以只张成一条直线;101010 个向量也可能只张成一个平面,此时它们不是无关的。
列张成列空间,由行张成的空间称为行空间,即行所有的组合得到行空间。
定义 \kern 10pt矩阵的行空间是 Rn\pmb {\textrm R}^nRn 的子空间,行张成行空间。
A 的行空间是 C(AT),就是 AT 的列空间。A\,的行空间是\,\pmb C(A^T),就是\,A^T\,的列空间。A的行空间是C(AT),就是AT的列空间。
m×nm\times nm×n 的矩阵的行有 nnn 个分量,它们是 Rn\pmb{\textrm R}^nRn 中的向量 —— 或者把它们直接写成列向量,我们可以通过转置矩阵来实现,不再关注 AAA 的行,而是关注ATA^TAT 的列。同样的数字,但是现在它是 C(AT)\pmb C(A^T)C(AT) 的列空间。AAA 的行空间是 Rn\pmb{\textrm R}^nRn 的子空间。
【例5】描述 AAA 的列空间与行空间:A=[142735]与 AT=[123475],此处 m=3,n=2A=\begin{bmatrix}1&4\\2&7\\3&5\end{bmatrix}与\,A^T=\begin{bmatrix}1&2&3\\4&7&5\end{bmatrix},此处\,m=3,n=2A=123475与AT=[142735],此处m=3,n=2AAA 的列空间是由它两个列张成的 R3\pmb{\textrm R^3}R3 中的平面,行空间是由它的三行(ATA^TAT 的三列)所张成的整个 R2\textrm {\pmb R}^2R2 空间。记住:行在 Rn\textrm {\pmb R}^nRn 中张成行空间,列在 Rm\textrm {\pmb R}^mRm 中张成列空间。同样的数字,不同的向量,不同的空间。
三、向量空间的基
两个向量不能张成整个 R2\textrm{\pmb R}^2R2,就算它们无关也不行;四个向量不可能无关,虽然它们可以张成整个 R3\pmb{\textrm R}^3R3。我们需要足够多的可以张成空间的向量(不能多),它就是 “基”(basis)。
定义 \kern 10pt向量空间的基是一组向量,它具有两个性质:基向量线性无关,它们能张成空间。\pmb{基向量线性无关,它们能张成空间。}基向量线性无关,它们能张成空间。
这两个性质是线性代数的基础,空间中的每一个向量 v\boldsymbol vv 都是基向量的组合,因为基向量张成这个空间。除此之外,得到向量 v\boldsymbol vv 的组合是唯一的,因为基向量 v1,⋯ ,vn\boldsymbol v_1,\cdots,\boldsymbol v_nv1,⋯,vn 是无关的:有且只有一种将向量 v 写成基向量的组合方式。\pmb{有且只有一种将向量\,\boldsymbol v\,写成基向量的组合方式。}有且只有一种将向量v写成基向量的组合方式。原因: 假设 v=a1v1+⋯+anvn\boldsymbol v=a_1\boldsymbol v_1+\cdots+a_n\boldsymbol v_nv=a1v1+⋯+anvn 且 v=b1v1+⋯+bnvn\boldsymbol v=b_1\boldsymbol v_1+\cdots+b_n\boldsymbol v_nv=b1v1+⋯+bnvn,两式相减得 (a1−b1)v1+⋯+(an−bn)vn=0(a_1-b_1)\boldsymbol v_1+\cdots+(a_n-b_n)\boldsymbol v_n=\boldsymbol 0(a1−b1)v1+⋯+(an−bn)vn=0,因为基向量 v′s\boldsymbol v'sv′s 是无关的,所以每个 ai−bi=0a_i-b_i=0ai−bi=0,因此 ai=bia_i=b_iai=bi,即只有一种得到 v\boldsymbol vv 的组合方式。
【例6】I=[1001]I=\begin{bmatrix}1&0\\0&1\end{bmatrix}I=[1001] 的列是 R2\pmb {\textrm R}^2R2 的标准基。基向量 i=[10],j=[01]是无关的,它们张成 R2基向量\,\boldsymbol i=\begin{bmatrix}1\\0\end{bmatrix},\boldsymbol j=\begin{bmatrix}0\\1\end{bmatrix}是无关的,它们张成\,\pmb{\textrm R}^2基向量i=[10],j=[01]是无关的,它们张成R2这一组是最好想到的基,向量 i\boldsymbol ii 是横向移动,向量 j\boldsymbol jj 是纵向移动。3×33\times33×3 的单位矩阵的列是标准基 i,j,k\boldsymbol i,\boldsymbol j,\boldsymbol ki,j,k,n×nn\times nn×n 的单位矩阵的列就是 Rn\textrm {\pmb R}^nRn 的标准基(Standard basis)。
但是基是不唯一的,一个向量空间有无数的基。
【例7】(重要)每一个 n×nn\times nn×n 的可逆矩阵的所有列都是 Rn\textrm{\pmb R}^nRn 的一组基:可逆矩阵无关列列空间是R3A=[100110111]奇异矩阵相关列列空间≠R3B=[101112112]\begin{matrix}\pmb{可逆矩阵}\\无关列\\列空间是\pmb {\textrm R}^3\end{matrix}\kern 15ptA=\begin{bmatrix}1&0&0\\1&1&0\\1&1&1\end{bmatrix}\kern 15pt\begin{matrix}\pmb{奇异矩阵}\\相关列\\列空间\neq\pmb {\textrm R}^3\end{matrix}\kern 15ptB=\begin{bmatrix}1&0&1\\1&1&2\\1&1&2\end{bmatrix}可逆矩阵无关列列空间是R3A=111011001奇异矩阵相关列列空间=R3B=111011122Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 的唯一解是 x=A−10=0\boldsymbol x=A^{-1}\boldsymbol 0=\boldsymbol 0x=A−10=0,它的列是无关的,张成整个 Rn\textrm{\pmb R}^nRn 空间 —— 因为每个向量 b\boldsymbol bb 都是列的组合。Ax=bA\boldsymbol x=\boldsymbol bAx=b 总有解 x=A−1b\boldsymbol x=A^{-1}\boldsymbol bx=A−1b,总结如下:
当向量 v1,⋯ ,vn\boldsymbol v_1,\cdots,\boldsymbol v_nv1,⋯,vn 恰好是 n×nn\times nn×n 可逆矩阵的列时,这些向量是 Rn\pmb {\textrm R}^nRn 的一组基。因此 Rn\pmb{\textrm R}^nRn 有无穷多组基。
当这些列线性相关,我们只取主元列 —— 上述 BBB 有主元的前两列,它们无关且张成列空间。
AAA 的主元列是列空间的一组基。AAA 的主元行是行空间的一组基,行简化阶梯形式 RRR 的主元行也是 AAA 的一组基。
【例8】一个不可逆矩阵,它的列不是任何空间的基。一个主元列一个主元行(r=1)A=[2436]简化为R=[1200]\begin{matrix}\pmb{一个主元列}\\\pmb{一个主元行}(r=1)\end{matrix}\kern 15ptA=\begin{bmatrix}2&4\\3&6\end{bmatrix}简化为\kern 5ptR=\begin{bmatrix}1&2\\0&0\end{bmatrix}一个主元列一个主元行(r=1)A=[2346]简化为R=[1020]AAA 的列 111 是主元列,单独这个列是列空间的基,AAA 的第二列是列空间另一个不同的基,因此第一列的所有非零倍数都是列空间的基。一般我们选择主元列作为基。
注意到 RRR 的主元列 (1,0)(1,0)(1,0) 的尾部是 000,这个列是 RRR 列空间的基,但是它不再属于 AAA 的列空间,AAA 和 RRR 的列空间不相同,它们的基也不同。(它们的维度相同。)
AAA 的行空间与 RRR 的行空间相同,它包含 (2,4),(1,2)(2,4),(1,2)(2,4),(1,2) 以及所有的这些向量任意倍数,对于基我们永远有无数种选择,一般情况下我们选择 RRR 的非零行(有主元的行),所以 AAA 这个秩一矩阵的基只有一个向量:列空间的基:[23]行空间的基:[12]列空间的基:\begin{bmatrix}2\\3\end{bmatrix}\kern 10pt行空间的基:\begin{bmatrix}1\\2\end{bmatrix}列空间的基:[23]行空间的基:[12]【例9】找到下面秩二矩阵的列空间与行空间的基:R=[120300140000]R=\begin{bmatrix}1&2&0&3\\0&0&1&4\\0&0&0&0\end{bmatrix}R=100200010340列 111 和列 333 是主元列,它们都是 RRR 列空间的一组基,RRR 的列空间中的向量都具有 b=(x,y,0)\boldsymbol b=(x,y,0)b=(x,y,0) 的形式,RRR 的列空间都是整个三维空间 xyzxyzxyz 中的 xyxyxy 平面,这个平面不是 R2\pmb{\textrm R}^2R2,它是 R3\pmb{\textrm R}^3R3 的一个子空间。列 222 和列 333 同样也是列空间的一组基,我们一般选择主元列。
RRR 的行空间是 R4\pmb{\textrm R}^4R4 的子空间,它最简单的基就是 RRR 的两个非零行。第三行(零行)也在行空间中,但是它不能作为行空间的基,因为基必须线性无关。
问题 \kern 10pt给定 R7\textrm {\pmb R}^7R7 中的 555 个向量,如何找到这 555 个向量所张成的空间的一组基?
解一:将这些向量当成矩阵 AAA 的行,利用消元法找到 RRR 的非零行。
解二:将这 555 个向量放入 AAA 的列,通过消元找到 AAA 的主元列(不是 RRR 的),这些主元列就是列空间的一组基。
其它的基可以会有多或少一些的向量吗?答案是没有,向量空间的所有基都有相同的向量个数。
任何一组基向量的个数,就是空间的维度。\pmb{任何一组基向量的个数,就是空间的维度。}任何一组基向量的个数,就是空间的维度。
四、向量空间的维度
我们可以证明上述结论:我们可以选择不同的基向量,但是每组基向量的个数是相同的。
如果 v1,v2,⋯ ,vn\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_nv1,v2,⋯,vn 和 w1,w2,⋯ ,wn\boldsymbol w_1,\boldsymbol w_2,\cdots,\boldsymbol w_nw1,w2,⋯,wn 是同一个向量空间的基,那么 m=nm=nm=n。
证明: 假设 w′s\boldsymbol w'sw′s 的个数比 v′s\boldsymbol v'sv′s 的个数多,即 n>mn>mn>m,我们需要导出矛盾。因为 v′s\boldsymbol v'sv′s 是一组基,所以 w1\boldsymbol w_1w1 一定是 v′s\boldsymbol v'sv′s 的组合,如果 w1=a11v1+a21v2+⋯+am1vm\boldsymbol w_1=a_{11}\boldsymbol v_1+a_{21}\boldsymbol v_2+\cdots+a_{m1}\boldsymbol v_mw1=a11v1+a21v2+⋯+am1vm,这个就是两个矩阵相乘 VAVAVA 的第一列:每个 w 都是v′s的组合W=[w1w2⋯wn]=[v1v2⋯vm][a11⋯a1n⋮⋮am1⋯amn]=VA\begin{matrix}\pmb{每个\,\boldsymbol w\,都是}\\\pmb{\boldsymbol v's的组合}\end{matrix}\kern 10ptW=\begin{bmatrix}\boldsymbol w_1&\boldsymbol w_2&\cdots&\boldsymbol w_n\end{bmatrix}=\begin{bmatrix}\boldsymbol v_1&\boldsymbol v_2&\cdots&\boldsymbol v_m\end{bmatrix}\begin{bmatrix}a_{11}&\cdots&a_{1n}\\\vdots&&\vdots\\a_{m1}&\cdots&a_{mn}\end{bmatrix}=VA每个w都是v′s的组合W=[w1w2⋯wn]=[v1v2⋯vm]a11⋮am1⋯⋯a1n⋮amn=VA我们不清楚每个 aija_{ij}aij 是多少,但是我们知道 AAA 的形状(m×nm\times nm×n)。第二个向量 w2\boldsymbol w_2w2 同样也是 v′s\boldsymbol v'sv′s 的组合,组合的系数就是 AAA 的第二列,关键是 AAA 的元素对于每个 v\boldsymbol vv 都有一行(a11v1,a12v1,⋯ ,a1nv1a_{11}\boldsymbol v_1,a_{12}\boldsymbol v_1,\cdots,a_{1n}\boldsymbol v_1a11v1,a12v1,⋯,a1nv1),对应于每个 w\boldsymbol ww 有一列(每个 w\boldsymbol ww 的系数对应于 AAA 的列)。由于 n>mn>mn>m,所以 AAA 是一个又矮又宽的矩阵,r<nr<nr<n,所以 Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 有非零解。
Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 则有 VAx=0VA\boldsymbol x=\boldsymbol 0VAx=0,即 Wx=0W\boldsymbol x=\boldsymbol 0Wx=0,即有 w′s\boldsymbol w'sw′s 的组合为零,所以 w′s\boldsymbol w'sw′s 相关。因此 w′s\boldsymbol w'sw′s 不可能是基,假设 n>mn>mn>m 的情况下的两种基是不存在的。
如果 m>nm>nm>n,我们可以交换 v′s\boldsymbol v'sv′s 和 w′s\boldsymbol w'sw′s,其余步骤同上。唯一无法导出矛盾的情况就是 m=nm=nm=n,即完成证明。
每组基向量的个数与空间有关,而不是特定的基。对于没一组基,这个数字不会变,它代表这空间的自由度。Rn\pmb{\textrm R}^nRn 空间的维度是 nnn,下面介绍这个重要概念 “维”,它也适用于其它的空间。
定义 \kern 10pt空间的维度就是每组基的向量个数。
这个符合我们的直觉,通过 v=(1,5,2)\boldsymbol v=(1,5,2)v=(1,5,2) 的直线维度为 111,它是一个子空间,这个子空间的基就是一个向量 v\boldsymbol vv。 垂直于该直线的平面是 x+5y+2z=0x+5y+2z=0x+5y+2z=0,这个平面的维度为 222。我们可以找到这个空间的一组基 (−5,1,0)(-5,1,0)(−5,1,0) 和 (−2,0,1)(-2,0,1)(−2,0,1),这组基只包含两个向量,所以维度是 222。
这个平面是矩阵 A=[152]A=\begin{bmatrix}1&5&2\end{bmatrix}A=[152] 的零空间,AAA 有两个自由变量,基的两个向量 (−5,1,0)(-5,1,0)(−5,1,0) 和 (−2,0,1)(-2,0,1)(−2,0,1) 就是 Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 的两个特殊解。n−rn-rn−r 个特殊解是零空间的一组基。C(A)\pmb C(A)C(A) 的维度是 rrr,N(A)\pmb N(A)N(A) 的维度是 n−rn-rn−r。
线性代数语言注释: 我们不会说 “空间的秩” 或者 “基的维度” 或 “矩阵的基”,这些术语没有意义。正确的表述为 “列空间的维度” 等于 “矩阵的秩”。
五、矩阵空间和函数空间的基
无关、基、维度这些概念并不局限于列向量,也可以用在矩阵空间和函数空间。我们可以问三个 3×43\times 43×4 的矩阵 A1,A2,A3A_1,A_2,A_3A1,A2,A3 是否无关,它们是在所有 3×43\times43×4 的矩阵所形成的空间中,某些组合可能得到零矩阵。我们也可以问 3×43\times43×4 的矩阵空间的维度是多少?(是 121212。)
微分方程 d2ydx2=y\displaystyle\frac{\textrm d^2y}{\textrm dx^2}=ydx2d2y=y 有一个解空间,其中的一组基是 y=exy=e^xy=ex 与 y=e−xy=e^{-x}y=e−x,通过基函数的个数可知这个所有解形成的解空间的维度是 222(因为是二阶导数,所以维度为 222)。
矩阵空间和函数空间相对于前的向量空间可能会有些奇怪,但是如果完全理解了基和维度的概念后,就可以将它们应用到除列向量之外的 “向量”(例如矩阵、函数等) 中。
矩阵空间 \kern 10pt向量空间 M\pmb{\textrm M}M 包含所有的 2×22\times22×2 的矩阵,它的维度是 444。一组基是A1,A2,A3,A4=[1000],[0100],[0010],[0001]\pmb{一组基是}\kern 10ptA_1,A_2,A_3,A_4=\begin{bmatrix}1&0\\0&0\end{bmatrix},\begin{bmatrix}0&1\\0&0\end{bmatrix},\begin{bmatrix}0&0\\1&0\end{bmatrix},\begin{bmatrix}0&0\\0&1\end{bmatrix}一组基是A1,A2,A3,A4=[1000],[0010],[0100],[0001]这些矩阵线性无关,我们不将它们看成列向量,而是整个矩阵。这 444 个矩阵组合可以生成 M\textrm{\pmb M}M 中的任意矩阵,因此它们张成了矩阵空间:每个 A 都是基矩阵的组合c1A1+c2A2+c3A3+c4A4=[c1c2c3c4]=A\begin{matrix}每个\,A\,都是\\基矩阵的组合\end{matrix}\kern 10ptc_1A_1+c_2A_2+c_3A_3+c_4A_4=\begin{bmatrix}c_1&c_2\\c_3&c_4\end{bmatrix}=A每个A都是基矩阵的组合c1A1+c2A2+c3A3+c4A4=[c1c3c2c4]=A当且仅当所有的 c′sc'sc′s 都为零时,AAA 才是零矩阵 —— 这就证明了 A1,A2,A3,A4A_1,A_2,A_3,A_4A1,A2,A3,A4 是无关的。
A1,A2,A4A_1,A_2,A_4A1,A2,A4 这三个矩阵是上三角矩阵这个子空间的一组基,它的维度是 333;A1,A4A_1,A_4A1,A4 是对角矩阵的一组基;那么对称矩阵的基是什么?A1,A4,A2+A3A_1,A_4,A_2+A_3A1,A4,A2+A3 是它的一组基。
更深入一些,考虑 n×nn\times nn×n 矩阵所形成的空间,其中一组基就是每个矩阵都只有一个元素是非零数(这个元素是 111),则有 n2n^2n2 种可能性,因此共有 n2n^2n2 个基矩阵:n×n 矩阵所形成的空间,维度是 n2上三角矩阵所形成的子空间,维度是 12n2+12n对角矩阵所形成的子空间,维度是 n对称矩阵所形成的子空间,维度是 12n2+12n\begin{array}{l}\pmb{n\times n\,矩阵所形成的空间,维度是\,n^2}\\\pmb{上三角矩阵所形成的子空间,维度是\,\frac{1}{2}n^2+\frac{1}{2}n}\\\pmb{对角矩阵所形成的子空间,维度是\,n}\\\pmb{对称矩阵所形成的子空间,维度是\,\frac{1}{2}n^2+\frac{1}{2}n}\end{array}n×n矩阵所形成的空间,维度是n2上三角矩阵所形成的子空间,维度是21n2+21n对角矩阵所形成的子空间,维度是n对称矩阵所形成的子空间,维度是21n2+21n函数空间 \kern10pt方程 d2ydx2=0,d2ydx2=−y,d2ydx2=y\displaystyle\frac{\textrm d^2y}{\textrm dx^2}=0,\frac{\textrm d^2y}{\textrm dx^2}=-y,\frac{\textrm d^2y}{\textrm dx^2}=ydx2d2y=0,dx2d2y=−y,dx2d2y=y 都与二阶导数有关,使用微积分我们可以解出函数 y(x)y(x)y(x):y′′=0通解是 y=cx+dy′′=−y通解是 y=csin x+dcos xy′′=y通解是 y=cex+de−x\begin{array}{ll}y''=0&通解是\,y=cx+d\\y''=-y&通解是\,y=c\sin\,x+d\cos\,x\\y''=y&通解是\,y=ce^x+de^{-x}\end{array}y′′=0y′′=−yy′′=y通解是y=cx+d通解是y=csinx+dcosx通解是y=cex+de−xy′′=−yy''=-yy′′=−y 的解空间有两个基函数 sin x\sin\,xsinx 和 cos x\cos\,xcosx;y′′=0y''=0y′′=0 的解空间的两个基函数是 xxx 和 111,这是二阶导数的零空间。这两个函数空间的维度都是 222(因为是二阶方程)。
y′′=2y''=2y′′=2 所有的解无法形成一个子空间,因为右侧得到 b=2b=2b=2 不是 000,它的一个特解是 y=x2y=x^2y=x2,完全解是 y(x)=x2+cx+dy(x)=x^2+cx+dy(x)=x2+cx+d,这些函数都满足 y′′=2y''=2y′′=2。注意,特解加上零空间中任意的函数 cx+dcx+dcx+d 就是完全解。线性微分方程和线性矩阵方程 Ax=bA\boldsymbol x=\boldsymbol bAx=b 很像,但是我们是用微积分的方法求解,而不是线性代数。
只包含零空间的空间 Z\textrm {\pmb Z}Z,它的维度是 000,空集合(不包含任何向量)是 Z\pmb{\textrm Z}Z 的基。基中不允许存在零向量,因为那样的话基就不可能线性无关。
六、主要内容总结
- 如果 x=0\boldsymbol x=\boldsymbol 0x=0 是 Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 的唯一解,则 AAA 的列线性无关。
- 如果向量 v1,v2,⋯ ,vr\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_rv1,v2,⋯,vr 的组合填满一个空间,则它们张成空间。
- 基是线性无关且张成空间的向量。这个空间的每个向量都是基向量的唯一组合。
- 空间中所有的基都有相同的向量个数,基中向量的个数就是空间的维度。
- 主元列是列空间的一组基,维度是 rrr。
七、例题
【例10】已知两个向量 v1=(1,2,0),v2=(2,3,0)\boldsymbol v_1=(1,2,0),\boldsymbol v_2=(2,3,0)v1=(1,2,0),v2=(2,3,0),回答下列问题:
(a)它们是否线性无关?
(b)它们是某一个空间的基吗?
(c)它们张成什么空间 V\pmb {\textrm V}V?
(d)空间 V\pmb{\textrm V}V 的维度是多少?
(e)哪个矩阵 AAA 的列空间是 V\textrm {\pmb V}V?
(f)哪个矩阵 AAA 的零空间是 V\textrm {\pmb V}V?
(g)描述所有的向量 v3\boldsymbol v_3v3,使得 v1,v2,v3\boldsymbol v_1,\boldsymbol v_2,\boldsymbol v_3v1,v2,v3 是 R3\textrm {\pmb R}^3R3 的一组基。
解: (a)v1\boldsymbol v_1v1 和 v2\boldsymbol v_2v2 是线性无关的,因为得到 0\boldsymbol 00 的唯一组合是 0v1+0v20\boldsymbol v_1+0\boldsymbol v_20v1+0v2。
(b)是的,它们是它们所张成空间的一组基。
(c)空间 V\pmb {\textrm V}V 包含所有的向量 (x,y,0)(x,y,0)(x,y,0),就是 R3\pmb{\textrm R}^3R3 空间的 xyxyxy 平面。
(d)空间 V\textrm {\pmb V}V 的维度是 222,因为它的基有两个向量。
(e)如果 AAA 每一列都是 v1\boldsymbol v_1v1 和 v2\boldsymbol v_2v2 的线性组合,则空间 V\pmb{\textrm V}V 的任意的 3×n3\times n3×n 的矩阵 AAA 的列空间,AAA 的秩为 222。特殊情况 AAA 只有两列 v1\boldsymbol v_1v1 和 v2\boldsymbol v_2v2。
(f)每行都是 (0,0,1)(0,0,1)(0,0,1) 的倍数的 m×3m\times 3m×3 的矩阵 BBB,它是秩一矩阵,零空间是 V\pmb{\textrm V}V。特殊的 B=[001]B=\begin{bmatrix}0&0&1\end{bmatrix}B=[001],有 Bv1=0,Bv2=0B\boldsymbol v_1=0,B\boldsymbol v_2=0Bv1=0,Bv2=0。
(g)任意的第三向量 v3=(a,b,c)\boldsymbol v_3=(a,b,c)v3=(a,b,c),其中 c≠0c\neq0c=0,均可构成 R3\textrm {\pmb R}^3R3 的一组基。
【例11】w1,w2,w3\boldsymbol w_1,\boldsymbol w_2,\boldsymbol w_3w1,w2,w3 这三个向量线性无关,它们的线性组合得到 v1,v2,v3\boldsymbol v_1,\boldsymbol v_2,\boldsymbol v_3v1,v2,v3。将组合写成矩阵形式 V=WBV=WBV=WB:v1=w1+w2v2=w1+2w2+w3v3=w2+cw3就是[v1v2v3]=[w1w2w3][11012101c]\begin{array}{l}\boldsymbol v_1=\boldsymbol w_1+\boldsymbol w_2\\\boldsymbol v_2=\boldsymbol w_1+2\boldsymbol w_2+\boldsymbol w_3\\\boldsymbol v_3=\kern 31pt\boldsymbol w_2+c\boldsymbol w_3\end{array}就是\kern 3pt\begin{bmatrix}\boldsymbol v_1&\boldsymbol v_2&\boldsymbol v_3\end{bmatrix}=\begin{bmatrix}\boldsymbol w_1&\boldsymbol w_2&\boldsymbol w_3\end{bmatrix}\begin{bmatrix}1&1&0\\1&2&1\\0&1&c\end{bmatrix}v1=w1+w2v2=w1+2w2+w3v3=w2+cw3就是[v1v2v3]=[w1w2w3]11012101c怎样可以验证 V=WBV=WBV=WB 是否有无关列?如果 c≠1c\neq1c=1,证明 v1,v2,v3\boldsymbol v_1,\boldsymbol v_2,\boldsymbol v_3v1,v2,v3 线性无关。如果 c=1c=1c=1,证明 v1,v2,v3\boldsymbol v_1,\boldsymbol v_2,\boldsymbol v_3v1,v2,v3 线性相关。
解: 我们使用第一个定义验证 VVV 是否有无关列:VVV 的零空间只包含零向量,x=0\boldsymbol x=\boldsymbol 0x=0 是 Vx=0V\boldsymbol x=\boldsymbol 0Vx=0 成立的唯一组合。
如果 c=1c=1c=1,可以通过两种方式判断列的相关性:首先,v1+v3=v2\boldsymbol v_1+\boldsymbol v_3=\boldsymbol v_2v1+v3=v2(w1+w2\boldsymbol w_1+\boldsymbol w_2w1+w2 与 w2+w3\boldsymbol w_2+\boldsymbol w_3w2+w3 相加得 w1+2w2+w3\boldsymbol w_1+2\boldsymbol w_2+\boldsymbol w_3w1+2w2+w3 即是 v2\boldsymbol v_2v2)。换言之,v1−v2+v3=0\boldsymbol v_1-\boldsymbol v_2+\boldsymbol v_3=\boldsymbol 0v1−v2+v3=0,即证明所有的 v′s\boldsymbol v'sv′s 不是无关的;
另一方法是检验 BBB 的零空间,如果 c=1c=1c=1,向量 x=(1,−1,1)\boldsymbol x=(1,-1,1)x=(1,−1,1) 在零空间中,有 Bx=0B\boldsymbol x=\boldsymbol 0Bx=0,则有 WBx=0WB\boldsymbol x=\boldsymbol 0WBx=0,即是 Vx=0V\boldsymbol x=\boldsymbol 0Vx=0,因此所有的 v′s\boldsymbol v'sv′s 是相关的。零空间中的向量 x=(1,−1,1)\boldsymbol x=(1,-1,1)x=(1,−1,1) 同样可以得到 v1−v2+v3=0\boldsymbol v_1-\boldsymbol v_2+\boldsymbol v_3=\boldsymbol 0v1−v2+v3=0。
假设 c≠1c\neq1c=1,则矩阵 BBB 是可逆的。所以若 x\boldsymbol xx 是任意的非零向量,则有 BxB\boldsymbol xBx 也不为零,因为 w′s\boldsymbol w'sw′s 是无关的,所以可得 WBxWB\boldsymbol xWBx 也不为零。因为 V=WBV=WBV=WB,即有 VxV\boldsymbol xVx 不为零,也就说明 x\boldsymbol xx 不在 VVV 的零空间中,即证明了 v1,v2,v3\boldsymbol v_1,\boldsymbol v_2,\boldsymbol v_3v1,v2,v3 线性无关。
一般规则:如果 BBB 可逆,则来自无关的 w′s\boldsymbol w'sw′s 的 v′s\boldsymbol v'sv′s 也是无关的。如果这些向量在 R3\pmb{\textrm R}^3R3 中,则它们不仅是无关的,也是 R3\textrm {\pmb R}^3R3 的一组基。当转换矩阵 BBB 是可逆的,则它将基 w′s\boldsymbol w'sw′s 转换成的 v′s\boldsymbol v'sv′s 也是基。
【例12】(重要例题)假设 v1,v2,⋯ ,vn\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_nv1,v2,⋯,vn 是 Rn\textrm {\pmb R}^nRn 的一组基,AAA 是 n×nn\times nn×n 的可逆矩阵。证明 Av1,Av2,⋯ ,AvnA\boldsymbol v_1,A\boldsymbol v_2,\cdots,A\boldsymbol v_nAv1,Av2,⋯,Avn 也是 Rn\textrm {\pmb R}^nRn 的一组基。
解: 矩阵语言:将基向量 v1,v2,⋯ ,vn\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_nv1,v2,⋯,vn 放在一个可逆矩阵 VVV 的列中,则 Av1,Av2,⋯ ,AvnA\boldsymbol v_1,A\boldsymbol v_2,\cdots,A\boldsymbol v_nAv1,Av2,⋯,Avn 就是 AVAVAV 的列,因为 AAA 可逆,则 AVAVAV 也可逆,它的列就是一组基。
向量语言:假设 c1Av1+c2Av2+⋯+cnAvn=0c_1A\boldsymbol v_1+c_2A\boldsymbol v_2+\cdots+c_nA\boldsymbol v_n=\boldsymbol 0c1Av1+c2Av2+⋯+cnAvn=0,也可以写成 Av=0A\boldsymbol v=\boldsymbol 0Av=0,其中 v=c1v1+c2v2+⋯+cnvn\boldsymbol v=c_1\boldsymbol v_1+c_2\boldsymbol v_2+\cdots+c_n\boldsymbol v_nv=c1v1+c2v2+⋯+cnvn。左边同时乘上 A−1A^{-1}A−1,可得 v=0\boldsymbol v=\boldsymbol 0v=0,因为 v′s\boldsymbol v'sv′s 是线性无关的,所以所有的 ci=0c_i=0ci=0,即证明了 Av′sA\boldsymbol v'sAv′s 的无关性。
为了证明 Av′sA\boldsymbol v'sAv′s 可以张成 Rn\textrm {\pmb R}^nRn,只需证明 c1Av1+c2Av2+⋯+cnAvn=bc_1A\boldsymbol v_1+c_2A\boldsymbol v_2+\cdots+c_nA\boldsymbol v_n=\boldsymbol bc1Av1+c2Av2+⋯+cnAvn=b 的可解性,两边左乘 A−1A^{-1}A−1 得, c1v1+c2v2+⋯+cnvn=A−1bc_1\boldsymbol v_1+c_2\boldsymbol v_2+\cdots+c_n\boldsymbol v_n=A^{-1}\boldsymbol bc1v1+c2v2+⋯+cnvn=A−1b,因为 v′s\boldsymbol v'sv′s 是一组基,所以该方程一定有解。
349

被折叠的 条评论
为什么被折叠?



