这一讲将完整地解出线性方程组,并详细说明解的结构。
1. 求解 A X = b AX=b AX=b
1.1 可解性
示例 1:
A = [ 1 2 2 2 2 4 6 8 3 6 8 10 ] (1) A=\begin{bmatrix}1&2&2&2\\2&4&6&8\\3&6&8&10\end{bmatrix}\tag{1} A= 1232462682810 (1)
我们知道通过消元可看出线性相关性
对于
A
A
A,其行
3
3
3为行
1
1
1与行
2
2
2之和,那么在求解
A
X
=
b
AX=b
AX=b时,
b
=
[
b
1
b
2
b
3
]
b=\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}
b=
b1b2b3
,其中
b
3
b_3
b3为
b
1
b_1
b1与
b
2
b_2
b2之和,即
b
3
=
b
1
+
b
2
b_3=b_1+b_2
b3=b1+b2。
如:
b
1
=
1
,
b
2
=
5
,
b
3
=
6
b_1=1,b_2=5,b_3=6
b1=1,b2=5,b3=6
并且,若方程可解,且左侧对应行的线性组合为 0 0 0,那么右侧常数的相同组合也必然为 0 0 0。
示例 2:
我们将线性方程组
A
X
=
b
AX=b
AX=b 写成增广矩阵形式,
A
=
[
1
2
2
2
2
4
6
8
3
6
8
10
]
,
b
=
[
b
1
b
2
b
3
]
A = \begin{bmatrix}1&2&2&2\\2&4&6&8\\3&6&8&10\end{bmatrix},b=\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}
A=
1232462682810
,b=
b1b2b3
增广矩阵
[
A
b
]
[A\ b]
[A b] 经行变换化为,
[
1
2
2
2
b
1
0
0
2
4
b
2
−
2
b
1
0
0
0
0
b
3
−
b
2
−
b
1
]
(2)
\left[\begin{array}{cccc|c}1&2&2&2&b_1\\0&0&2&4&b_2 - 2b_1\\0&0&0&0&b_3 - b_2 - b_1\end{array}\right]\tag{2}
100200220240b1b2−2b1b3−b2−b1
(2)。
为使方程组有解,因 A A A中最后一行系数全为 0 0 0,对应地要求 b 3 − b 2 − b 1 = 0 b_3 - b_2 - b_1 = 0 b3−b2−b1=0,即 b 1 + b 2 = b 3 b_1 + b_2 = b_3 b1+b2=b3
因此对于 b = [ b 1 b 2 b 3 ] b=\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix} b= b1b2b3 ,其中 b 3 b_3 b3必须满足 b 3 = b 1 + b 2 b_3=b_1+b_2 b3=b1+b2,所以当 b = [ 1 5 6 ] b=\begin{bmatrix}1\\5\\6\end{bmatrix} b= 156 时,方程组有解。
现在,我们有了可解性的定义:可解性(Solvability),即 A X = b AX=b AX=b的有解条件。
前面讲列空间时提到,AX=b有解,当且仅当b属于A的列空间。
这次,我们给出另一种描述方式:
如果A的各行的线性组合得到零行,由于方程组两侧需要进行相同的消元操作,那么b中分量的相同组合也必须为零。
下面通过示例给出求解 A X = b AX=b AX=b通解的运算步骤:
- 先求一个特解 X p X_p Xp:将所有自由变量设为 0 0 0,解出 A X = b AX=b AX=b的主变量,得到特解。
示例 3:
我们将 b = [ 1 5 6 ] b = \begin{bmatrix}1\\5\\6\end{bmatrix} b= 156 代入(2)式中,得到增广矩阵 [ A b ] [A\ b] [A b]:
[ 1 2 2 2 1 0 0 2 4 3 0 0 0 0 0 ] \left[\begin{array}{cccc|c} 1&2&2&2&1\\ 0&0&2&4&3\\ 0&0&0&0&0 \end{array}\right] 100200220240130
设 x 2 = 0 , x 4 = 0 x_2 = 0,x_4 = 0 x2=0,x4=0,将其写成方程组形式:
{
x
1
+
2
x
3
=
1
2
x
3
=
3
\begin{cases} x_1 + 2x_3=1\\ 2x_3 = 3 \end{cases}
{x1+2x3=12x3=3
解得
x
1
=
−
2
x_1=-2
x1=−2,
x
3
=
3
2
x_3=\frac{3}{2}
x3=23,此时便得到了一个特解:
X
p
=
[
−
2
0
3
2
0
]
X_p=\begin{bmatrix} -2\\0\\\frac{3}{2}\\0 \end{bmatrix}
Xp=
−20230
- 再求 A X = 0 AX=0 AX=0的通解 X N X_N XN,即零空间的任意向量:通解 X = X p + X N X=X_p+X_N X=Xp+XN
对此的解释是:
由于
A
X
p
=
b
AX_p=b
AXp=b且
A
X
N
=
0
AX_N=0
AXN=0,那么
A
X
p
+
A
X
N
=
b
+
0
=
b
AX_p+AX_N=b+0=b
AXp+AXN=b+0=b,即对于
A
X
=
b
AX=b
AX=b某解,其与零空间任意向量之和仍成立。
因此对例 3,它的通解 X = [ − 2 0 3 2 0 ] + C 1 [ − 2 1 0 0 ] + C 2 [ 2 0 − 2 1 ] X=\begin{bmatrix}-2\\0\\\frac{3}{2}\\0\end{bmatrix}+C_1\begin{bmatrix}-2\\1\\0\\0\end{bmatrix}+C_2\begin{bmatrix}2\\0\\-2\\1\end{bmatrix} X= −20230 +C1 −2100 +C2 20−21
这里的零空间通解为上一讲中求解
A
X
=
0
AX=0
AX=0时所得
另外,对于特解
X
p
X_p
Xp,其不可乘以任意常数,因为
A
(
C
X
p
)
=
C
(
A
X
p
)
=
C
b
A(CX_p)=C(AX_p)=Cb
A(CXp)=C(AXp)=Cb。
现在,我们思考下此通解在几何上的图像是什么样的?
对于
X
N
X_N
XN,由于其是两个四维列向量的线性组合,所以是
R
4
\mathbb{R}^4
R4上的二维子空间,即过原点的二维平面。
想象下,
X
N
X_N
XN是
R
4
\mathbb{R}^4
R4上的二维平面,那么其加上
X
p
X_p
Xp后,就是经过
X
p
X_p
Xp的二维平面,即
X
=
X
p
+
X
N
X=X_p+X_N
X=Xp+XN。
2. 满秩
上一讲我们给出了矩阵秩的定义,即主元的个数,那么它与矩阵 A A A有什么关系。
对于 m × n m\times n m×n的矩阵 A A A,其秩为 r r r,有 r ≤ m r\leq m r≤m且 r ≤ n r\leq n r≤n,即主元个数不会超过行数或列数,并且每列至多有一个主元。
2.1 列满秩
列满秩就是矩阵的秩等于矩阵列数,即 r = n < m r=n<m r=n<m
此时意味着矩阵中没有自由变量,最多有一个解,
N
(
A
)
N(A)
N(A)中只有零向量。
由此可知,列满秩时,对于
A
X
=
b
AX=b
AX=b,此时无解或有唯一解,对于
A
X
=
0
AX=0
AX=0,此时只有零向量解。
示例 4:
2.2 行满秩
行满秩就是矩阵的秩等于行数,即 r = m < n r=m<n r=m<n
这种情况下,
b
b
b为什么时,
A
X
=
b
AX=b
AX=b有解?
行满秩,表示每一行都有主元,不会出现零行,因此对任意
b
b
b均有解。
由此可知,行满秩时, A X = b AX=b AX=b必然有无穷多解。
更详细的解释是:
对于
m
×
n
m\times n
m×n的矩阵A,其必然是在
R
m
\mathbb{R}^m
Rm空间内,此时若其秩
r
=
m
≤
n
r=m\leq n
r=m≤n,意味着在
m
m
m维空间中,
A
A
A含
r
r
r个线性无关的
m
m
m维向量,其所有的线性组合必然覆盖整个
R
m
\mathbb{R}^m
Rm空间,显然此时
A
X
=
b
AX=b
AX=b必有无穷解。
2.3 满秩方阵
满秩方阵就是矩阵的秩等于行数等于列数,即 r = m = n r=m=n r=m=n
此时求解 A X = b AX=b AX=b,必然有唯一解。
示例 6:
A
=
[
1
2
3
1
]
A = \begin{bmatrix} 1 & 2 \\ 3 & 1 \end{bmatrix}
A=[1321]
R
=
[
1
0
0
1
]
R = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}
R=[1001]
满秩方阵的行最简形 R R R为单位矩阵,此时有唯一解 X = b X = b X=b。
总结:对 A X = b AX=b AX=b,
- r = m = n r=m=n r=m=n,有唯一解
- r = n ≤ m r=n\leq m r=n≤m,无解或有唯一解
- r = m < n r=m<n r=m<n,必然有无穷多解
- r < m r<m r<m且 r < n r<n r<n,无解或有无穷多解