一、Ax = b
在求解 Ax=0A\boldsymbol x=\boldsymbol 0Ax=0 时,我们将其转化成 Rx=0R\boldsymbol x=\boldsymbol 0Rx=0,将自由变量赋予特殊值(1 或 0),主元变量即可通过回代求出。这个过程中我们没有关注右侧的 b\boldsymbol bb,这是因为它一直为零,解 x\boldsymbol xx 在 AAA 的零空间。
如果 b\boldsymbol bb 不再是零时,右侧与左侧需要进行同样的行操作,Ax=bA\boldsymbol x=\boldsymbol bAx=b 可以简化成 Rx=dR\boldsymbol x=\boldsymbol dRx=d 的形式,它们的解是相同的。将 b\boldsymbol bb 作为额外的一列加在初始矩阵后,即增广矩阵。例如在 AAA 后加入右侧向量 (b1,b2,b3)=(1,6,7)(b_1,b_2,b_3)=(1,6,7)(b1,b2,b3)=(1,6,7) 可以得到一个增广矩阵 [Ab]\begin{bmatrix}A&b\end{bmatrix}[Ab]:[130200141316][x1x2x3x4]=[167]增广矩阵[130210014613167]=[Ab]\begin{bmatrix}1&3&0&2\\0&0&1&4\\1&3&1&6\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\\x_4\end{bmatrix}=\begin{bmatrix}\pmb1\\\pmb6\\\pmb7\end{bmatrix}\kern 5pt增广矩阵\kern 5pt\begin{bmatrix}1&3&0&2&\pmb1\\0&0&1&4&\pmb6\\1&3&1&6&\pmb7\end{bmatrix}=\begin{bmatrix}A&\pmb b\end{bmatrix}101303011246x1x2x3x4=167增广矩阵101303011246167=[Ab]当我们对 AAA 使用消元法得到 RRR 时,也要对 b\boldsymbol bb 进行同样的操作。
上例是行 333 减去行 111,然后行 333 再减去行 222,此时得到 RRR 一行全为零,b\boldsymbol bb 也成了新的右侧向量 d=(1,6,0)\boldsymbol d=(1,6,0)d=(1,6,0):[130200140000][x1x2x3x4]=[160]增广矩阵[130210014600000]=[Rd]\begin{bmatrix}1&3&0&2\\0&0&1&4\\0&0&0&0\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\\x_4\end{bmatrix}=\begin{bmatrix}\pmb1\\\pmb6\\\pmb0\end{bmatrix}\kern 5pt增广矩阵\kern 5pt\begin{bmatrix}1&3&0&2&\pmb1\\0&0&1&4&\pmb6\\0&0&0&0&\pmb0\end{bmatrix}=\begin{bmatrix}R&\pmb d\end{bmatrix}100300010240x1x2x3x4=160增广矩阵100300010240160=[Rd]最后一零 000 非常重要,第三个方程变为了 0=00=00=0,所以方程有解。在初始矩阵 AAA 中,第一行加上第二行等于第三行,如果方程一致,那么右侧也要一致。右侧向量 b\boldsymbol bb 最重要的性质是 1+6=71+6=71+6=7,这样就会得到 0=00=00=0。
对于一般的 b=(b1,b2,b3)\boldsymbol b=(b_1,b_2,b_3)b=(b1,b2,b3) 的增广矩阵:[Ab]=[1302b10014b21316b3]→[1302b10014b20000b3−b1−b2]=[Rd]\begin{bmatrix}A&b\end{bmatrix}=\begin{bmatrix}1&3&0&2&\pmb{b_1}\\0&0&1&4&\pmb{b_2}\\1&3&1&6&\pmb{b_3}\end{bmatrix}\rightarrow\begin{bmatrix}1&3&0&2&\pmb{b_1}\kern 43pt\\0&0&1&4&\pmb{b_2}\kern 43pt\\0&0&0&0&\pmb{b_3-b_1-b_2}\end{bmatrix}=\begin{bmatrix}R&\pmb d\end{bmatrix}[Ab]=101303011246b1b2b3→100300010240b1b2b3−b1−b2=[Rd]只有当 b3−b1−b2=0b_3-b_1-b_2=0b3−b1−b2=0 时,第三个方程才是 0=00=00=0,即 b1+b2=b3b_1+b_2=b_3b1+b2=b3。
二、一个特解 Axpx_pxp = b
将自由变量全部设为 000:x2=x4=0x_2=x_4=0x2=x4=0,则两个非零方程会得到两个主元变量 x1=1,x3=6x_1=1,x_3=6x1=1,x3=6,这样就很简单求得了一个特解(particular solution)。对于 Ax=bA\boldsymbol x=\boldsymbol bAx=b(也是 Rx=dR\boldsymbol x=\boldsymbol dRx=d )的一个特解就是 xp=(1,0,6,0)\boldsymbol x_p=(1,0,6,0)xp=(1,0,6,0)。求特解的方法:自由变量 = 0,主元变量来自 d\boldsymbol dd。如果解存在,R 的零行对应的 d 也必须为零。因为 I 在 R 的主元行和主元列,所以 xparticular 来自于 dRxp=[130200140000][1060]=[160]主元变量1,6自由变量0,0解 xp=(1,0,6,0)如果解存在,R\,的零行对应的\,\boldsymbol d\,也必须为零。因为\,I\,在\,R\,的主元行和主元列,所以\, \boldsymbol x_{particular} \,来自于\,\boldsymbol d\\R\boldsymbol x_p=\begin{bmatrix}\pmb1&3&\pmb0&2\\\pmb0&0&\pmb1&4\\0&0&0&0\end{bmatrix}\begin{bmatrix}\pmb1\\0\\\pmb6\\0\end{bmatrix}=\begin{bmatrix}\pmb1\\\pmb6\\0\end{bmatrix}\kern 10pt\begin{matrix}\pmb{主元变量1,6}\\\pmb{自由变量0,0}\\\kern 24pt\pmb{解\,\boldsymbol x_p=(1,0,6,0)}\end{matrix}如果解存在,R的零行对应的d也必须为零。因为I在R的主元行和主元列,所以xparticular来自于dRxp=1003000102401060=160主元变量1,6自由变量0,0解xp=(1,0,6,0)因为我们将自由变量全部设为零,所以当简化至 RRR 后,这些步骤很快就能完成。将自由变量设为零后,主元变量就可以在右侧的向量 d\boldsymbol dd 中看到。
xparticular特解是求解Axp=bxnullspacen−r个特殊解是求解Axn=0\boldsymbol x_{particular}\kern 10pt特解是求解\kern 50ptA\boldsymbol x_p=\boldsymbol b\\\boldsymbol x_{nullspace}\kern 10pt\kern 5ptn-r个特殊解是求解\kern 5ptA\boldsymbol x_n=\boldsymbol 0xparticular特解是求解Axp=bxnullspacen−r个特殊解是求解Axn=0
特解是 (1,0,6,0)(1,0,6,0)(1,0,6,0),Rx=0R\boldsymbol x=\boldsymbol 0Rx=0 的两个特殊解(special solution)(零空间)来自 RRR 的两个自由列,通过反转 3,2,43,2,43,2,4 的符号来得到。
Ax=bA\boldsymbol x=\boldsymbol bAx=b 的完全解写成 xp+xn\boldsymbol x_p+\boldsymbol x_nxp+xn:
完全解一个xp很多xnx=xp+xn=[1060]+x2[−3100]+x4[−20−41]\begin{matrix}\pmb{完全解}\\\pmb{一个x_p}\\\pmb{很多x_n}\end{matrix}\kern 10pt\boldsymbol x=\boldsymbol x_p+\boldsymbol x_n=\begin{bmatrix}1\\0\\6\\0\end{bmatrix}+x_2\begin{bmatrix}-3\\\kern 7pt1\\\kern 7pt0\\\kern 7pt0\end{bmatrix}+x_4\begin{bmatrix}-2\\\kern 7pt0\\-4\\\kern 7pt1\end{bmatrix}完全解一个xp很多xnx=xp+xn=1060+x2−3100+x4−20−41
问题: 假设 AAA 是可逆的方阵,m=n=rm=n=rm=n=r,则 xp\boldsymbol x_pxp 和 xnx_nxn 是什么?
答: 特解 xp=A−1b\boldsymbol x_p=A^{-1}\boldsymbol bxp=A−1b 有且只有一个唯一解。不存在特殊解或自由变量。R=IR=IR=I 没有零行,零空间只有一个向量 xn=0\boldsymbol x_n=\boldsymbol 0xn=0,完全解是 x=xp+xn=A−1b+0\boldsymbol x = \boldsymbol x_p+\boldsymbol x_n=A^{-1}\boldsymbol b+\boldsymbol 0x=xp+xn=A−1b+0。
若 AAA 是可逆的方阵,N(A)\pmb N(A)N(A) 只含有零向量,[Ab]\begin{bmatrix}A&\boldsymbol b\end{bmatrix}[Ab] 可以简化成 [IA−1b]\begin{bmatrix}I&A^{-1}\boldsymbol b\end{bmatrix}[IA−1b],AAA 最终会变成 III,Ax=bA\boldsymbol x=\boldsymbol bAx=b 会变成 x=A−1b\boldsymbol x=A^{-1}\boldsymbol bx=A−1b 就是 d\boldsymbol dd。这个虽说是特殊情况,但是实际上方形可逆矩阵是最常见的。
对于小型矩阵,我们可以将 [Ab]\begin{bmatrix}A&\boldsymbol b\end{bmatrix}[Ab] 简化成 [Rd]\begin{bmatrix}R&\boldsymbol d\end{bmatrix}[Rd]。对于大型矩阵,我们可以使用 MATLAB,一个特解可以使用 x=A\b\boldsymbol x=A\backslash \boldsymbol bx=A\b(表示 A−1A^{-1}A−1 乘 b\boldsymbol bb )得到。
【例1】若要使 Ax=bA\boldsymbol x=\boldsymbol bAx=b 有解,(b1,b2,b3)(b_1,b_2,b_3)(b1,b2,b3) 需要满足什么条件?A=[1112−2−3],b=[b1b2b3]A=\begin{bmatrix}\kern 7pt1&\kern 7pt1\\\kern 7pt1&\kern 7pt2\\-2&-3\end{bmatrix},\kern 5pt\boldsymbol b=\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}A=11−212−3,b=b1b2b3条件是 b\boldsymbol bb 必须在 AAA 的列空间中。求完全解 x=xp+xn\boldsymbol x=\boldsymbol x_p+\boldsymbol x_nx=xp+xn。
解: 加入额外的 b\boldsymbol bb 得到增广矩阵 [Ab]\begin{bmatrix}A&\boldsymbol b\end{bmatrix}[Ab],在该矩阵中从行 222 减去行 111,然后行 333 加上 222 倍的行 111,得到 [Rd]\begin{bmatrix}R&\boldsymbol d\end{bmatrix}[Rd]:[11b112b2−2−3b3]→[11b101b2−b10−1b3+2b1]→[102b1−b201b2−b100b3+b1+b2]\begin{bmatrix}\kern 7pt1&\kern 7pt1&b_1\\\kern 7pt1&\kern 7pt2&b_2\\-2&-3&b_3\end{bmatrix}\rightarrow\begin{bmatrix}1&\kern 7pt1&b_1\\0&\kern 7pt1&b_2-b_1\\0&-1&b_3+2b_1\end{bmatrix}\rightarrow\begin{bmatrix}1&0&2b_1-b_2\\0&1&b_2-b_1\\0&0&\pmb{b_3+b_1+b_2}\end{bmatrix}11−212−3b1b2b3→10011−1b1b2−b1b3+2b1→1000102b1−b2b2−b1b3+b1+b2当 b1+b2+b3=0b_1+b_2+b_3=0b1+b2+b3=0 时,可以使得最后一个方程是 0=00=00=0,这个是 b\boldsymbol bb 在 AAA 列空间中的条件,此时 Ax=bA\boldsymbol x=\boldsymbol bAx=b 有解。AAA 的三个行相加产生零行,因为方程两边的一致性,所以 b\boldsymbol bb 的分量相加也必须为零。
上例中由于 n−r=2−2=0n-r=2-2=0n−r=2−2=0,所以没有自由变量,也就没有特殊解。零空间的解是 xn=0\boldsymbol x_n=\boldsymbol 0xn=0。Ax=bA\boldsymbol x=\boldsymbol bAx=b 和 Rx=dR\boldsymbol x=\boldsymbol dRx=d 的特解在最后一列 d\boldsymbol dd 的顶端:Ax=b 的唯一解x=xp+xn=[2b1−b2b2−b1]+[00]A\boldsymbol x=\boldsymbol b\,的唯一解\kern 10pt\boldsymbol x=\boldsymbol x_p+\boldsymbol x_n=\begin{bmatrix}2b_1-b_2\\b_2-b_1\end{bmatrix}+\begin{bmatrix}0\\0\end{bmatrix}Ax=b的唯一解x=xp+xn=[2b1−b2b2−b1]+[00]如果 b1+b2+b3b_1+b_2+b_3b1+b2+b3 不为零,则 Ax=bA\boldsymbol x=\boldsymbol bAx=b 无解(xp\boldsymbol x_pxp 和 x\boldsymbol xx 不存在)。
例1是一个典型的重要例子:AAA 是列满秩的。每一列都有主元,秩 r=nr=nr=n。这个矩阵又高又细(m≥nm\geq nm≥n),当 AAA 简化到 RRR 时,III 会在 RRR 的最顶端:列满秩R=[I0]=[n×n 的 Im−n 个零行](3.3.1)\pmb{列满秩}\kern 10ptR=\begin{bmatrix}I\\0\end{bmatrix}=\begin{bmatrix}n\times n\,的\,I\\m-n\,个零行\end{bmatrix}\kern 15pt(3.3.1)列满秩R=[I0]=[n×n的Im−n个零行](3.3.1)这种情况没有自由列或自由变量,零空间是 Z=零向量\pmb {\textrm Z}={零向量}Z=零向量。
列满秩(r=n)的矩阵 AAA 有下列性质:
- A 的每一列都是主元列。
- 没有自由变量或特殊解。
- 零空间 N(A)\pmb N(A)N(A) 仅包含零向量 x=0\boldsymbol x=\boldsymbol 0x=0。
- 若 Ax=bA\boldsymbol x=\boldsymbol bAx=b 有一个解(也可能没有),则这个解是唯一解。
这种情况下,AAA 或 RRR 的零空间收缩至零向量,Ax=bA\boldsymbol x=\boldsymbol bAx=b 的解是唯一的(如果存在的话),RRR 中会有 m−nm-nm−n 个零行,而为了保证这些行最终会得到 0=00=00=0,在 b\boldsymbol bb 中会有 m−nm-nm−n 个条件,此时 b\boldsymbol bb 在列空间中。
列满秩 r=nr=nr=n 时,Ax=bA\boldsymbol x=\boldsymbol bAx=b 有一个解或无解。
三、完全解
另外一个极端的情况就是行满秩,此时 Ax=bA\boldsymbol x=\boldsymbol bAx=b 有一个或无穷多个解,AAA 是又矮又宽(m≤nm\leq nm≤n)。如果 r=m\pmb{r=m}r=m,矩阵 AAA 有行满秩。这些行是无关的,每一行都有一个主元。
【例2】系统 Ax=bA\boldsymbol x=\boldsymbol bAx=b 有 n=3n=3n=3 个未知数,但是只有 m=2m=2m=2 个方程:行满秩x+y+z=3x+2y−z=4(秩 r=m=2)\pmb{行满秩}\kern 10pt\begin{matrix}x+y+z=3\\x+2y-z=4\kern 5pt\end{matrix}\kern 10pt(秩\,r=m=2)行满秩x+y+z=3x+2y−z=4(秩r=m=2)这是 xyzxyzxyz 空间中的两个平面,它们不平行,所以会相交于一条直线,这条直线就是该系统的解,我们通过消元法可以得到这条直线。特解就是这条直线上的一点,再加上零空间向量 xn\pmb{x_n}xn,可以使得该点在Figure 3.3 上的直线上移动。x=xp+xn\boldsymbol x=\boldsymbol x_p+\boldsymbol x_nx=xp+xn 就可以得到整条直线上的解。
对 [Ab]\begin{bmatrix}A&\boldsymbol b\end{bmatrix}[Ab] 进行消元可以得到 xp\boldsymbol x_pxp 和 xn\boldsymbol x_nxn。行 222 减去行 111,然后行 111 再减去行 222 可得:[111312−14]→[111301−21]→[103201−21]=[Rd]\begin{bmatrix}1&1&\kern 7pt1&\pmb3\\1&2&-1&\pmb4\end{bmatrix}\rightarrow\begin{bmatrix}1&1&\kern 7pt1&\pmb3\\0&1&-2&\pmb1\end{bmatrix}\rightarrow\begin{bmatrix}1&0&\kern 7pt3&\pmb2\\0&1&-2&\pmb1\end{bmatrix}=\begin{bmatrix}R&\boldsymbol d\end{bmatrix}[11121−134]→[10111−231]→[10013−221]=[Rd]特解有自由变量 x3=0x_3=0x3=0,特殊解有自由变量 x3=1x_3=1x3=1:xparticular直接来自有右侧的 d:xp=(2,1,0)xspecial来自于R 第三列(自由列):s=(−3,2,1)\boldsymbol x_{\textrm{particular}}直接来自有右侧的\,\boldsymbol d:\boldsymbol x_p=(2,1,0)\kern 22pt\\\boldsymbol x_{\textrm{special}}来自于 R\,第三列(自由列):\boldsymbol s=(-3,2,1)xparticular直接来自有右侧的d:xp=(2,1,0)xspecial来自于R第三列(自由列):s=(−3,2,1)下面检验一下 xp\boldsymbol x_pxp 和 s\boldsymbol ss 是否满足原始方程 Axp=bA\boldsymbol x_p=\boldsymbol bAxp=b 和 As=0A\boldsymbol s=\boldsymbol 0As=0:2+1=32+2=4−3+2+1=0−3+4−1=0\begin{matrix}2+1=3\\2+2=4\end{matrix}\kern 25pt\begin{matrix}-3+2+1=0\\-3+4-1=0\end{matrix}2+1=32+2=4−3+2+1=0−3+4−1=0零空间解 xn\boldsymbol x_nxn 是 s\boldsymbol ss 的任意倍数。系统的解沿着直线移动,起点是 xpaticular\boldsymbol x_{\textrm{paticular}}xpaticular。注意完全解的写法:
完全解x=xp+xn=[210]+x3[−321]\pmb{完全解}\kern 20pt\boldsymbol x=\boldsymbol x_p+\boldsymbol x_n=\begin{bmatrix}2\\1\\0\end{bmatrix}+x_3\begin{bmatrix}-3\\\kern 7pt2\\\kern 7pt1\end{bmatrix}完全解x=xp+xn=210+x3−321
这条解的直线就是 Figure3.3 画出来的,直线的任意一点都可以选成特解,我们一般选择 x3=0x_3=0x3=0 这一点。
特解不能乘任意常数!特殊解才需要这个常数,因为要得所有零空间的 xn\boldsymbol x_nxn。
下面总结一些这种又矮又宽的行满秩的情况。如果 m<nm<nm<n,则方程 Ax=bA\boldsymbol x=\boldsymbol bAx=b 是欠定的(undetermined),即有很多解。
行满秩 (r=m)的矩阵有以下性质:
- 所有的行都有主元,R\pmb RR 没有零行。
- 对于任意的右侧向量 b\boldsymbol bb,Ax=bA\boldsymbol x=\boldsymbol bAx=b 都有解。
- 列空间是整个 Rm\pmb {\textrm R}^mRm 空间。
- AAA 的零空间中有 n−r=n−mn-r=n-mn−r=n−m 个特殊解。
这种 mmm 个主元的情况,这些行都线性无关。因此 ATA^TAT 的列也是线性无关,ATA^TAT 的零空间是零向量。
总结共有 444 种与秩相关的可能性:线性方程组与秩 r 相关的 4 种可能性r=m 且 r=n方形可逆Ax=b 有 1 个解r=m 且 r<n矮且宽Ax=b 有 ∞ 多解r<m 且 r=n高且细Ax=b 有 0 或 1 个解r<m 且 r<n非满秩Ax=b 有 0 或 ∞ 多解\pmb{线性方程组与秩\,r\,相关的\,4\,种可能性}\kern 90pt\\\begin{matrix}r=m\,且\,r=n&方形可逆&A\boldsymbol x=\boldsymbol b\,有\,1\,个解\\r=m\,且\,r<n&矮且宽&\kern 5ptA\boldsymbol x=\boldsymbol b\,有\,\infty\,多解\\r<m\,且\,r=n&高且细&\kern 17ptA\boldsymbol x=\boldsymbol b\,有\,0\,或\,1\,个解\\r<m\,且\,r<n&非满秩&\kern 22ptA\boldsymbol x=\boldsymbol b\,有\,0\,或\,\infty\,多解\end{matrix}线性方程组与秩r相关的4种可能性r=m且r=nr=m且r<nr<m且r=nr<m且r<n方形可逆矮且宽高且细非满秩Ax=b有1个解Ax=b有∞多解Ax=b有0或1个解Ax=b有0或∞多解行简化矩阵 RRR 和矩阵 AAA 是相同种类的,如果主元列正好第一个出现,则可以列出 RRR 的 444 种可能性。Rx=dR\boldsymbol x=\boldsymbol dRx=d(和原始的 Ax=bA\boldsymbol x=\boldsymbol bAx=b )有解,d\boldsymbol dd 的后面一定有 m−rm-rm−r 个零行,FFF 是 RRR 的自由部分。R 的四种形式它们的秩[I][IF][I0][IF00]r=m=nr=m<nr=n<mr<m,r<n\begin{matrix}R\,的四种形式\\\\它们的秩\end{matrix}\begin{matrix}\begin{bmatrix}I\end{bmatrix}&\begin{bmatrix}I&F\end{bmatrix}&\begin{bmatrix}I\\0\end{bmatrix}&\begin{bmatrix}I&F\\0&0\end{bmatrix}\\\\r=m=n&r=m<n&r=n<m&r<m,r<n\end{matrix}R的四种形式它们的秩[I]r=m=n[IF]r=m<n[I0]r=n<m[I0F0]r<m,r<n形式 111 和 222 有行满秩 r=mr=mr=m,形式 111 和 333 有列满秩 r=nr=nr=n,形式 444 理论上是最常见的,但是实际上很少见。
如果主元列并不是都在前面出现,这 III 和 FFF 会有交叉的现象。
四、主要内容总结
- 秩 rrr 是主元的个数,行简化矩阵 RRR 有 m−rm-rm−r 个零行。
- Ax=bA\boldsymbol x=\boldsymbol bAx=b 有解,当且仅当最后 m−rm-rm−r 个方程可以简化为 0=00=00=0。
- 一个特解 xp\boldsymbol x_pxp 的所有自由变量都为 000。
- 主元变量是在自由变量选定后被确定的。
- 列满秩矩阵 r=nr=nr=n 没有自由变量:一个或无解。
- 行满秩矩阵 r=mr=mr=m,如果 m=nm=nm=n 则有一个解;如果 m<nm<nm<n 则有无穷多解。
五、例题
【例3】该问题将消元法(主元列和回代)与列空间 - 零空间 - 秩 - 可解性联系起来。AAA 的秩是 222:Ax=b是x1+2x2+3x3+5x4=b12x1+4x2+8x3+12x4=b23x1+6x2+7x3+13x4=b3A\boldsymbol x=\boldsymbol b\kern 10pt是\kern 10pt\begin{matrix}x_1+2x_2+3x_3+5x_4=b_1\\2x_1+4x_2+8x_3+12x_4=b_2\\3x_1+6x_2+7x_3+13x_4=b_3\end{matrix}Ax=b是x1+2x2+3x3+5x4=b12x1+4x2+8x3+12x4=b23x1+6x2+7x3+13x4=b3
- 简化 [Ab]\begin{bmatrix}A&\boldsymbol b\end{bmatrix}[Ab] 到 [Uc]\begin{bmatrix}U&\boldsymbol c\end{bmatrix}[Uc],使 Ax=bA\boldsymbol x=\boldsymbol bAx=b 变成三角系统 Ux=cU\boldsymbol x=\boldsymbol cUx=c。
- 若要 Ax=bA\boldsymbol x=\boldsymbol bAx=b 有解,则 b1,b2,b3b_1,b_2,b_3b1,b2,b3 需要满足什么条件?
- 描述 AAA 的列空间,是 R3\pmb{\textrm R}^3R3 的哪个平面?
- 描述 AAA 的零空间,R4\textrm{\pmb R}^4R4 中的特殊解是什么?
- 设 b=(0,6,−6)\boldsymbol b=(0,6,-6)b=(0,6,−6),简化 [Uc]\begin{bmatrix}U&\boldsymbol c\end{bmatrix}[Uc] 到 [Rd]\begin{bmatrix}R&\boldsymbol d\end{bmatrix}[Rd]:特殊解来自 RRR,特解来自于 d\boldsymbol dd。
- 找到一个 Ax=(0,6,−6)A\boldsymbol x=(0,6,-6)Ax=(0,6,−6) 的特解,然后写出完全解。
解:
- 消元法的乘数是 2,3,−12,3,-12,3,−1,消元后 [Ab]\begin{bmatrix}A&\boldsymbol b\end{bmatrix}[Ab] 会变成 [Uc]\begin{bmatrix}U&\boldsymbol c\end{bmatrix}[Uc]:[1235b124812b236713b3]→[1235b10022b2−2b100−2−2b3−3b1]→[1235b10022b2−2b10000b3+b2−5b1]\begin{bmatrix}1&2&3&5&\pmb{b_1}\\2&4&8&12&\pmb{b_2}\\3&6&7&13&\pmb{b_3}\end{bmatrix}\rightarrow\left[\begin{array}{ccrr|l}1&2&3&5&\pmb{b_1}\\0&0&2&2&\pmb{b_2-2b_1}\\0&0&-2&-2&\pmb{b_3-3b_1}\end{array}\right]\rightarrow\left[\begin{array}{cccc|l}1&2&3&5&\pmb{b_1}\\0&0&2&2&\pmb{b_2-2b_1}\\0&0&0&0&\pmb{b_3+b_2-5b_1}\end{array}\right]12324638751213b1b2b3→10020032−252−2b1b2−2b1b3−3b1→100200320520b1b2−2b1b3+b2−5b1
- b3+b2−5b1=0b_3+b_2-5b_1=0b3+b2−5b1=0 是方程解的条件,此时最后一个方程可以简化为 0=00=00=0。
- 第一种描述: 列空间是包含主元列 (1,2,3)(1,2,3)(1,2,3) 和 (3,8,7)(3,8,7)(3,8,7) 所有线性组合的平面,主元列是第 111 列和第 333 列;
第二种描述: 列空间包含满足 b3+b2−5b1=0b_3+b_2-5b_1=0b3+b2−5b1=0 的所有向量;该条件使得方程 Ax=bA\boldsymbol x=\boldsymbol bAx=b 有解,所以 b\boldsymbol bb 就在列空间中。AAA 中的所有列都满足 b3+b2−5b1=0b_3+b_2-5b_1=0b3+b2−5b1=0,这也是第一种描述中的平面方程。 - 特殊解有自由变量 x2=1,x4=0x_2=1,x_4=0x2=1,x4=0 和 x2=0,x4=1x_2=0,x_4=1x2=0,x4=1:Ax=0 的特殊解回代进 Ux=c或改变 R 中 2,2,1 的符号s1=[−2100]s2=[−20−11]\begin{array}{lc}A\boldsymbol x=\boldsymbol 0\,的特殊解\\回代进\,U\boldsymbol x=\boldsymbol c\\或改变\,R\,中\,2,2,1\,的符号\end{array}\kern 10pt\boldsymbol s_1=\begin{bmatrix}-2\\\kern 7pt1\\\kern 7pt0\\\kern 7pt0\end{bmatrix}\kern 15pt\boldsymbol s_2=\begin{bmatrix}-2\\\kern 7pt0\\-1\\\kern 7pt1\end{bmatrix}Ax=0的特殊解回代进Ux=c或改变R中2,2,1的符号s1=−2100s2=−20−11R4\pmb{\textrm R}^4R4 中的零空间 N(A)\pmb N(A)N(A) 包含所有的 xn=c1s1+c2s2\boldsymbol x_n=c_1\boldsymbol s_1+c_2\boldsymbol s_2xn=c1s1+c2s2。
- 简化后的矩阵 RRR,第三列从 UUU 的 (3,2,0)(3,2,0)(3,2,0) 变成了 (0,1,0)(0,1,0)(0,1,0),右边的从 c=(0,6,0)\boldsymbol c=(0,6,0)c=(0,6,0) 变成了 d=(−9,3,0)\boldsymbol d=(-9,3,0)d=(−9,3,0),xp\boldsymbol x_pxp 中的 −9-9−9 和 333 都来自于 d\boldsymbol dd:[Uc]=[123500022600000]→[Rd]=[1202−90011300000]\begin{bmatrix}U&\boldsymbol c\end{bmatrix}=\begin{bmatrix}1&2&3&5&\pmb0\\0&0&2&2&\pmb6\\0&0&0&0&\pmb0\end{bmatrix}\rightarrow\begin{bmatrix}R&\boldsymbol d\end{bmatrix}=\begin{bmatrix}1&2&0&2&\pmb{-9}\\0&0&1&1&\kern 7pt\pmb3\\0&0&0&0&\kern 7pt\pmb0\end{bmatrix}[Uc]=100200320520060→[Rd]=100200010210−930
- 将所有自由变量都设为 000,然后在 Ux=cU\boldsymbol x=\boldsymbol cUx=c 中回代,或者直接取自 d\boldsymbol dd:Axp=b 的特解从向量 d 中得到−9 和 3自由变量 x2 和 x4 都为 0xp=[−9030]\begin{array}{l}A\boldsymbol x_p=\boldsymbol b\,的特解\\从向量\,\boldsymbol d\,中得到-9\,和\,3\\自由变量\,x_2\,和\,x_4\,都为\,0\end{array}\kern 10pt\boldsymbol x_p=\begin{bmatrix}-9\\\kern 7pt0\\\kern 7pt3\\\kern 7pt0\end{bmatrix}Axp=b的特解从向量d中得到−9和3自由变量x2和x4都为0xp=−9030Ax=(0,6,−6)A\boldsymbol x=(0,6,-6)Ax=(0,6,−6) 的完全解是 x=xp+xn=xp+c1s1+c2s2\boldsymbol x=\boldsymbol x_p+\boldsymbol x_n=\boldsymbol x_p+c_1\boldsymbol s_1+c_2\boldsymbol s_2x=xp+xn=xp+c1s1+c2s2。
【例4】假设已知 Ax=bA\boldsymbol x=\boldsymbol bAx=b 的一些信息,其中 b\boldsymbol bb 是一个特定值。下面描述可以得到 m,n,rm,n,rm,n,r(和 AAA)的什么信息?还有 b\boldsymbol bb 的可能信息?
- 只有一个解。
- Ax=bA\boldsymbol x=\boldsymbol bAx=b 所有的解有 x=[21]+c[11]\boldsymbol x=\begin{bmatrix}2\\1\end{bmatrix}+c\begin{bmatrix}1\\1\end{bmatrix}x=[21]+c[11] 的形式。
- 无解。
- Ax=bA\boldsymbol x=\boldsymbol bAx=b 所有的解有 x=[110]+c[101]\boldsymbol x=\begin{bmatrix}1\\1\\0\end{bmatrix}+c\begin{bmatrix}1\\0\\1\end{bmatrix}x=110+c101 的形式。
- 有无穷多解。
解: 1、只有一个解的情况:AAA 是列满秩 r=nr=nr=n,AAA 的零空间仅含有零向量,一定有 m≥nm\geq nm≥n。
2、AAA 肯定有 n=2n=2n=2 个列(mmm 是任意的),其中 [11]\begin{bmatrix}1\\1\end{bmatrix}[11] 在 AAA 的零空间,列 222 是列 111 的负号,且 A≠0A\neq0A=0,秩 r=1r=1r=1。因为 [21]\begin{bmatrix}2\\1\end{bmatrix}[21] 是一个解,所以 b=2(column 2)+(column 1)\boldsymbol b=2(\textrm{column} \,2)+(\textrm{column}\,1)b=2(column2)+(column1),xp\boldsymbol x_pxp 也可以选择 [10]\begin{bmatrix}1\\0\end{bmatrix}[10]。
3、无解时,仅能得到 b\boldsymbol bb 不在 AAA 的列空间中,AAA 的秩 r<mr<mr<m。而且 b≠0\boldsymbol b\neq\boldsymbol 0b=0,否则 x=0\boldsymbol x=\boldsymbol 0x=0 就是一个解。
4、AAA 肯定有 n=3n=3n=3 个列,其中 [101]\begin{bmatrix}1\\0\\1\end{bmatrix}101 在 AAA 的零空间中,列 333 是列 111 的负号,且列 222 肯定不是列 111 的倍数,否则零空间将会有另外一个特殊解,因此 AAA 的秩 r=3−1=2r=3-1=2r=3−1=2。AAA 肯定有 m≥2m\geq2m≥2 行,右侧向量 b=column 1+column 2\boldsymbol b=\textrm{column\,1}+\textrm{column\,2}b=column1+column2。
5、有无穷多解的情况:零空间肯定包含非零向量,秩 r<nr<nr<n(非列满秩),b\boldsymbol bb 肯定是在 AAA 的列空间中。但是我们不清楚是不是每个 b\boldsymbol bb 都在列空间中(列满秩任意的右侧向量 b\boldsymbol bb 只能在列空间中),所以无法确定 rrr 与 mmm 是否相等。
【例5】利用前向消元求完全解 x=xp+xn\boldsymbol x=\boldsymbol x_p+\boldsymbol x_nx=xp+xn:[121024484868][x1x2x3x4]=[4210]\begin{bmatrix}1&2&1&0\\2&4&4&8\\4&8&6&8\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\\x_4\end{bmatrix}=\begin{bmatrix}4\\2\\10\end{bmatrix}124248146088x1x2x3x4=4210找到 y1,y2,y3y_1,y_2,y_3y1,y2,y3,使得 y1(row 1)+y2(row 2)+y3(row 3)=零行y_1(\textrm{row}\,1)+y_2(\textrm{row\,2})+y_3(\textrm{row\,3})=零行y1(row1)+y2(row2)+y3(row3)=零行。验证 b=(4,2,10)\boldsymbol b=(4,2,10)b=(4,2,10) 满足 y1b1+y2b2+y3b3=0y_1b_1+y_2b_2+y_3b_3=0y1b1+y2b2+y3b3=0,为什么该条件是方程有解和 b\boldsymbol bb 在列空间的条件?
解: 对 [Ab]\begin{bmatrix}A&\boldsymbol b\end{bmatrix}[Ab] 进行前向消元会在 [Uc]\begin{bmatrix}U&\boldsymbol c\end{bmatrix}[Uc] 中产生一个零行,第三个方程会变成 0=00=00=0,方程有一致性(有解):[1210424482486810]→[121040028−60028−6]→[121040028−600000]\begin{bmatrix}1&2&1&0&\pmb 4\\2&4&4&8&\pmb2\\4&8&6&8&\pmb{10}\end{bmatrix}\rightarrow\begin{bmatrix}1&2&1&0&\pmb4\\0&0&2&8&\pmb{-6}\\0&0&2&8&\pmb{-6}\end{bmatrix}\rightarrow\begin{bmatrix}1&2&1&0&\pmb4\\0&0&2&8&\pmb{-6}\\0&0&0&0&\pmb0\end{bmatrix}1242481460884210→1002001220884−6−6→1002001200804−60列 111 和列 333 是主元列,x2x_2x2 和 x4x_4x4 是自由变量,如果将自由变量设为 000,那么通过回代就可以求出特解,还可以继续化简得到 RRR。
设自由变量为 000,则由 Rx=dR\boldsymbol x=\boldsymbol dRx=d 可得到特解 xp=(7,0,−3,0)\boldsymbol x_p=(7,0,-3,0)xp=(7,0,−3,0):[121040028−600000]→[121040014−300000]→[120−470014−300000]\begin{bmatrix}1&2&1&0&\pmb4\\0&0&2&8&\pmb{-6}\\0&0&0&0&\pmb0\end{bmatrix}\rightarrow\begin{bmatrix}1&2&1&0&\pmb4\\0&0&1&4&\pmb{-3}\\0&0&0&0&\pmb0\end{bmatrix}\rightarrow\begin{bmatrix}1&2&0&-4&\pmb7\\0&0&1&4&\pmb{-3}\\0&0&0&0&\pmb0\end{bmatrix}1002001200804−60→1002001100404−30→100200010−4407−30设自由变量 x2,x4x_2,x_4x2,x4 分别为 1,01,01,0 和 0,10,10,1,则可求出当 b=0\boldsymbol b=\boldsymbol 0b=0 时零空间部分 xn\boldsymbol x_nxn:特殊解s1=(−2,1,0,0)s2=(4,0,−4,1)\pmb{特殊解}\kern 10pt\boldsymbol s_1=(-2,1,0,0)\kern 10pt\boldsymbol s_2=(4,0,-4,1)特殊解s1=(−2,1,0,0)s2=(4,0,−4,1)则 Ax=bA\boldsymbol x=\boldsymbol bAx=b(和 Rx=dR\boldsymbol x=\boldsymbol dRx=d)的完全解 x=xp+c1s1+c2s2\boldsymbol x=\boldsymbol x_p+c_1\boldsymbol s_1+c_2\boldsymbol s_2x=xp+c1s1+c2s2。
对于矩阵 AAA,有 2(row 1)+(row 2)−(row 3)=(0,0,0,0)2(\textrm{row\,1})+(\textrm{row\,2})-(\textrm{row\,3})=(0,0,0,0)2(row1)+(row2)−(row3)=(0,0,0,0),因此 y=(2,1,−1)\boldsymbol y=(2,1,-1)y=(2,1,−1),对于 b\boldsymbol bb 来说同样的组合是 2⋅(4)+1⋅(2)−1⋅(10)=02\cdot(4)+1\cdot(2)-1\cdot(10)=02⋅(4)+1⋅(2)−1⋅(10)=0。
如果行的组合(左侧)得到零行,则右侧同样的组合也会得到 000,若没有得到 000 则方程无解。
换一种表述方法:若 AAA 的每一列都垂直于 (2,1,−1)(2,1,-1)(2,1,−1),则这些列的任意组合 b\boldsymbol bb 也与 y\boldsymbol yy 垂直,否则 b\boldsymbol bb 就不再 AAA 的列空间中,Ax=bA\boldsymbol x=\boldsymbol bAx=b 就无解。
如果 y\boldsymbol yy 在 ATA^TAT 的零空间中,则 y\boldsymbol yy 肯定垂直于所有 AAA 列空间中的 b\boldsymbol bb。