第一章 矩阵与线性方程组(二十一)
1. 广义逆矩阵的计算
令 A m × n A_{m\times n} Am×n具有秩 r r r。若 A = F G A=FG A=FG,其中, F m × r F_{m\times r} Fm×r的为 r r r(满列秩矩阵),且 G r × n G_{r\times n} Gr×n的秩也为 r r r(满行秩矩阵),则称 A = F G A=FG A=FG为矩阵 A A A的满秩分解
那么,是不是任意一个矩阵都存在满秩分解呢?下面的命题给出了这个问题的肯定答案。
命题1
一个秩为
r
r
r的
m
×
n
m\times n
m×n矩阵
A
A
A可以分解为
A
=
K
m
×
r
L
r
×
n
A=K_{m\times r}L{r\times n}
A=Km×rLr×n
式中,K和L分别具有满列秩和满行秩。
算法1(矩阵的满秩分解算法)
(1) 利用行初等变换将矩阵
A
A
A化为阶梯型,即
(2) 对单位矩阵执行逆行初等变换,得到逆矩阵
(3) 利用逆矩阵
P
−
1
P^{-1}
P−1的前
r
r
r列构造矩阵
F
F
F。
(4) 书写满秩分解结果
A
=
F
G
A=FG
A=FG。
(2)中的逆行初等变换如下:
- 第 i i i行和第 j j j行的互换 R i ↔ R j R_i↔R_j Ri↔Rj,的逆变换是 R j ↔ R i R_j↔R_i Rj↔Ri.
- 初等行变换 a R i aR_i aRi的逆变换为 a − 1 R a^{-1}R a−1R。
- 初等行变换 R i + a R j R_i+aR_j Ri+aRj的逆变换为 R i − a R j R_i-aR_j Ri−aRj.
一旦获得矩阵 A m × n A_{m\times n} Am×n的满秩分解后,即可根据下面的引理求出 A A A的广义逆矩阵 A − 1 A^{-1} A−1
引理1
若矩阵
A
m
×
n
A_{m\times n}
Am×n,具有秩
r
r
r,且其满秩分解为
A
=
F
G
A=FG
A=FG,其中,
F
m
×
r
F_{m\times r}
Fm×r为满列秩;
G
r
×
n
G_{r\times n}
Gr×n为满行秩,则
A
−
=
G
T
(
F
T
A
G
T
)
−
1
F
T
A^-=G^T(F^TAG^T)^{-1}F^T
A−=GT(FTAGT)−1FT
是
A
A
A的一个广义逆矩阵。
算法2(广义逆矩阵的计算)
(1) 计算矩阵
A
m
×
n
A_{m\times n}
Am×n的满秩分解
A
=
F
G
A=FG
A=FG。
(2) 求广义逆矩阵
A
−
=
G
T
(
F
T
A
G
T
)
−
1
F
T
A^-=G^T(F^TAG^T)^{-1}F^T
A−=GT(FTAGT)−1FT
下面是广义逆矩阵的递推计算公式。
(1) 令
A
A
A是一个
m
×
n
m \times n
m×n矩阵,
u
u
u和
v
v
v分别是
m
×
1
m\times 1
m×1和
n
×
1
n\times 1
n×1向量,则
(
A
+
u
v
T
)
−
=
A
−
(
A
−
u
)
(
v
T
A
−
)
1
+
v
T
A
−
u
(A+uv^T)^-=A^-\frac{(A^-u)(v^TA^-)}{1+v^TA^-u}
(A+uvT)−=A−1+vTA−u(A−u)(vTA−)
其中,假定
v
T
A
−
u
≠
−
1
v^TA^-u≠-1
vTA−u=−1。
(2)分块矩阵的广义逆矩阵的计算公式
若
M
=
[
A
C
C
H
B
]
M= \begin{bmatrix} A & C \\ C^H & B \end{bmatrix}
M=[ACHCB]
式中,
A
=
X
1
H
X
1
,
B
=
X
2
H
X
2
,
C
=
X
1
H
X
2
A=X_1^HX_1,B=X_2^HX_2,C=X_1^HX_2
A=X1HX1,B=X2HX2,C=X1HX2。
若
D
=
B
−
C
H
A
−
C
D=B-C^HA^-C
D=B−CHA−C,则
M
−
=
[
A
−
+
A
−
C
D
−
C
H
A
−
−
A
−
C
D
−
−
D
−
C
H
A
−
D
−
]
M^-= \begin{bmatrix} A^-+A^-CD^-C^HA^- & -A^-CD^- \\ -D^-C^HA^- & D^- \end{bmatrix}
M−=[A−+A−CD−CHA−−D−CHA−−A−CD−D−]
2. 一致方程的最小范数解
举一个简单的例子,假定线性方程为
x
1
+
2
x
2
=
10
x_1+2x_2=10
x1+2x2=10
这显然是一个一致方程。
如下图所示,直线
x
1
+
2
x
2
=
10
x_1+2x_2=10
x1+2x2=10上的所有点
(
x
1
,
x
2
)
(x_1,x_2)
(x1,x2)都是方程的解即通解。
如果希望确定唯一的解,就必须增加某个约束条件,求满足该条件的唯一解。作为约束条件,这里要求得到的解的范数为最小。这样得出的唯一解称为最小范数解。
由于
x
x
x的范数最小等同非向量
x
x
x的端点与原点的距离最小,故最小范数解也称最短距离解。
在本例中,“与原点的距离最短的解”为(2,4),见下图。
下面讨论一般情况下线性方程
A
x
=
y
Ax=y
Ax=y的最小范数解。先讨论其通解。
定理1
令
n
×
m
n\times m
n×m矩阵
A
−
A^-
A−是
m
×
n
m\times n
m×n矩阵
A
A
A的任意一个广义逆矩阵,则
(1) 齐次方程
A
x
=
0
Ax=0
Ax=0的一个通解为
x
=
(
I
−
A
−
A
)
z
x=(I-A^-A)z
x=(I−A−A)z,其中,
z
z
z是
n
×
1
n\times 1
n×1任意向量。
(2) 非齐次方程
A
x
=
y
Ax=y
Ax=y为一致方程的充分必要条件是
A
A
−
y
=
y
AA^-y=y
AA−y=y
(3) 非齐次方程
A
x
=
y
Ax=y
Ax=y的一个通解为
x
=
A
−
y
+
(
I
−
A
−
A
)
z
x=A^-y+(I-A^-A)z
x=A−y+(I−A−A)z
式中,
z
z
z为
n
×
1
n\times 1
n×1任意向量。
由于对一个一致方程
A
x
=
y
Ax=y
Ax=y,存在着通解公式,一个令我们感兴趣的问题是:是否存在一个
y
y
y无关的广义逆矩阵
G
G
G选择,使得解
G
y
Gy
Gy在所有的解中具有最小范数?换言之,如果广义逆矩阵
G
G
G存在的话,我们希望它满足条件
min
A
x
=
y
∣
∣
x
∣
∣
=
∣
∣
G
y
∣
∣
\min_{Ax=y}||x||=||Gy||
Ax=ymin∣∣x∣∣=∣∣Gy∣∣
如果上式满足,则称
G
y
Gy
Gy为线性一致方程
A
x
=
y
Ax=y
Ax=y的最小范数解,并称广义逆矩阵
G
G
G为最小范数广义逆矩阵。
考虑矩阵
A
m
×
n
A_{m\times n}
Am×n和向量
x
n
×
1
y
m
×
1
x_{n\times 1}y_{m\times 1}
xn×1ym×1。于是,
<
A
x
,
y
>
<Ax,y>
<Ax,y>是
m
m
m阶向量空间的内积,记作
<
A
x
,
y
>
m
<Ax,y>_m
<Ax,y>m。矩阵
A
m
×
n
A_{m\times n}
Am×n的伴随矩阵用符号
A
#
A^\#
A#表示,定义为将
m
m
m阶向量空间的内积等价变换为
n
n
n阶向量的内积的一个映射,即有
<
A
x
,
y
>
m
=
<
x
,
A
#
y
>
n
<Ax,y>_m=<x,A^\#y>_n
<Ax,y>m=<x,A#y>n
特别地,若
A
#
=
A
A^\#=A
A#=A,则称
A
A
A为自伴随矩阵。显然,自伴随矩阵一定是正方矩阵。
伴随矩阵具有以下性质:
(1)
(
A
#
)
#
=
A
(A^\#)^\# = A
(A#)#=A。
(2)
(
A
B
)
#
=
B
#
A
#
(AB)^\#=B^\#A^\#
(AB)#=B#A#。
(3)
<
A
x
,
B
y
>
=
0
,
∀
x
,
y
↔
A
#
B
=
O
<Ax,By>=0,\forall x,y \leftrightarrow A^\#B=O
<Ax,By>=0,∀x,y↔A#B=O。
(4)
A
#
=
A
T
A^\#=A^T
A#=AT(若
A
A
A为实矩阵)或
A
#
=
A
A^\#=A
A#=A(若
A
A
A为复矩阵)。
定理2
G
y
Gy
Gy是一致方程
A
x
=
y
Ax=y
Ax=y的最小范数解,当且仅当
A
G
A
=
A
,
(
G
A
)
#
=
G
A
AGA=A, (GA)^\#=GA
AGA=A,(GA)#=GA
关于最小范数解,有以下两点注释:
注释1 充分必要条件
A
G
A
=
A
,
(
G
A
)
#
=
G
A
AGA=A,(GA)^\#=GA
AGA=A,(GA)#=GA可以等价写作
G
A
A
#
=
−
A
#
GAA^\#=-A^\#
GAA#=−A#。
注释2 最小范数解是唯一的,虽然最小范数广义逆矩阵 G G G有可能不唯一。
特别地,我们来讨论当
A
m
×
n
A_{m\times n}
Am×n具有满行秩
m
m
m时,线性方程
A
x
=
y
Ax=y
Ax=y的最小范数解。由于
A
A
A满行秩,故增广矩阵
[
A
,
y
]
[A,y]
[A,y]的秩与
A
A
A的秩相同,即线性方程
A
x
=
y
Ax=y
Ax=y是一致方程。另一方面,矩阵乘积
A
A
H
AA^H
AAH 可逆,故存在右伪逆矩阵
A
H
(
A
A
H
)
−
1
A^H(AA^H)^{-1}
AH(AAH)−1。与之对应的解为
x
°
=
A
H
(
A
A
H
)
−
1
y
x^°=A^H(AA^H)^{-1}y
x°=AH(AAH)−1y
3. 非一致方程的最小二乘解
考虑非一致方程
A
x
=
y
Ax=y
Ax=y的求解。由于是非一致方程,故不存在严格满足方程的解。
换言之,非一致方程只能够有近似解。因此,我们很自然地希望寻找一个使得方程两边的误差平方和为最小的解。这样一种解称为非一致方程的最小二乘解。具体说来,若用
x
^
\widehat{x}
x
代表最小二乘解,则它应该满足
∣
∣
A
x
^
−
y
∣
∣
=
inf
x
∣
∣
A
x
−
y
∣
∣
||A\widehat{x}-y||=\inf_x||Ax-y||
∣∣Ax
−y∣∣=xinf∣∣Ax−y∣∣
式中,
i
n
f
inf
inf表示函数的下确界。
定理1
令
G
G
G是某个矩阵,则
x
^
=
G
y
\widehat{x}=Gy
x
=Gy是非一致方程
A
x
=
y
Ax=y
Ax=y的最小二乘解当且仅当
A
#
A
G
=
A
#
A^\#AG=A^\#
A#AG=A#
或者等价为
A
G
A
=
A
,
(
A
G
)
#
=
A
G
AGA=A,(AG)^\#=AG
AGA=A,(AG)#=AG
关于非一致方程的最小二乘解,有下面的两点注释:
注释1 非一致方程的最小二乘解有可能不是唯一的,但是不同的最小二乘解得到的
A
x
Ax
Ax和
A
x
−
y
Ax-y
Ax−y是唯一的。
注释2 非一致方程
A
x
=
y
Ax=y
Ax=y的最小二乘解的通解形式火
x
^
=
G
y
+
(
I
−
G
A
)
z
,
z
任意
\widehat{x}=Gy+(I-GA)z,z任意
x
=Gy+(I−GA)z,z任意
考虑非一致方程
A
x
=
y
Ax=y
Ax=y的矩阵
A
A
A具有满列秩的特殊情况。此时,矩阵乘积
A
H
A
A^HA
AHA非奇异。
下面证明,解
x
°
=
(
A
H
A
)
−
1
A
H
y
x°=(A^HA)^{-1}A^Hy
x°=(AHA)−1AHy
就是一个最小二乘解。
令
x
x
x是任何其他一个解,易知
∣
∣
A
x
−
y
∣
∣
2
=
∣
∣
A
(
x
−
x
°
)
+
A
x
°
−
y
∣
∣
2
||Ax-y||^2=||A(x-x°)+ Ax°-y||^2
∣∣Ax−y∣∣2=∣∣A(x−x°)+Ax°−y∣∣2
=
∣
∣
A
(
x
−
x
°
)
+
[
A
(
A
H
A
)
−
1
A
H
−
I
m
]
y
∣
∣
2
=||A(x-x°)+ [A(A^HA)^{-1}A^H - I_m]y||^{2}
=∣∣A(x−x°)+[A(AHA)−1AH−Im]y∣∣2
=
∣
∣
A
(
x
−
x
°
)
∣
∣
2
+
∣
∣
[
A
(
A
H
A
)
−
1
A
H
−
I
m
]
y
∣
∣
2
+
2
[
A
(
x
−
x
°
)
]
H
[
A
(
A
H
A
)
−
1
A
H
−
I
m
]
y
= ||A(x - x°)||^2 + ||[A(A^HA)^{-1}A^H - I_m]y||^2+2[A(x-x°)]^H[A(A^H A)^{-1}A^H-I_m]y
=∣∣A(x−x°)∣∣2+∣∣[A(AHA)−1AH−Im]y∣∣2+2[A(x−x°)]H[A(AHA)−1AH−Im]y
但是最后一个等式的第三项等于零,即
[
A
(
x
−
x
°
)
]
H
[
A
(
A
H
A
)
−
1
A
H
−
I
m
]
y
[A(x-x°)]^H[A(A^HA)^{-1}A^H-I_m]y
[A(x−x°)]H[A(AHA)−1AH−Im]y
=
(
x
−
x
°
)
H
[
A
H
A
(
A
H
A
)
−
1
A
H
−
A
H
]
y
= (x -x°)^H[A^HA(A^HA)^{-1}A^H-A^H]y
=(x−x°)H[AHA(AHA)−1AH−AH]y
=
(
x
−
x
°
)
H
(
A
H
−
A
H
)
y
=
0
=(x-x°)^H(A^H-A^H)y =0
=(x−x°)H(AH−AH)y=0
因此,上简化为
∣
∣
A
x
−
y
∣
∣
2
=
∣
∣
A
(
x
−
x
°
)
∣
∣
2
+
∣
∣
A
(
A
H
A
)
−
1
A
H
y
−
y
∣
∣
2
||Ax -y||^2 =|| A(x -x°)||^2 + ||A(A^HA)^{-1}A^Hy - y||^2
∣∣Ax−y∣∣2=∣∣A(x−x°)∣∣2+∣∣A(AHA)−1AHy−y∣∣2
=
∣
∣
A
(
x
−
x
°
)
∣
∣
2
+
∣
∣
A
x
°
−
y
∣
∣
2
= ||A(x - x°)||^2 + || Ax° - y||^2
=∣∣A(x−x°)∣∣2+∣∣Ax°−y∣∣2
由于
∣
∣
A
(
x
−
x
°
)
∣
∣
2
>
0
||A(x - x°)||^2>0
∣∣A(x−x°)∣∣2>0,故:
∣
∣
A
x
−
y
∣
∣
2
≥
∣
∣
A
x
°
−
y
∣
∣
2
,
∀
x
,
y
||Ax-y||^2≥ ||Ax° -y||^2, \forall x,y
∣∣Ax−y∣∣2≥∣∣Ax°−y∣∣2,∀x,y
即是说,
x
°
x°
x°确实是矩阵
A
A
A满列秩时,非一致方程
A
x
=
y
Ax=y
Ax=y的一个最小二乘解。