矩阵分析与应用+张贤达

第一章 矩阵与线性方程组(二十一)

1. 广义逆矩阵的计算

A m × n A_{m\times n} Am×n具有秩 r r r。若 A = F G A=FG A=FG,其中, F m × r F_{m\times r} Fm×r的为 r r r(满列秩矩阵),且 G r × n G_{r\times n} Gr×n的秩也为 r r r(满行秩矩阵),则称 A = F G A=FG A=FG为矩阵 A A A的满秩分解

那么,是不是任意一个矩阵都存在满秩分解呢?下面的命题给出了这个问题的肯定答案。
命题1
一个秩为 r r r m × n m\times n m×n矩阵 A A A可以分解为
A = K m × r L r × n A=K_{m\times r}L{r\times n} A=Km×rLr×n
式中,K和L分别具有满列秩和满行秩。

算法1(矩阵的满秩分解算法)
(1) 利用行初等变换将矩阵 A A A化为阶梯型,即
在这里插入图片描述
(2) 对单位矩阵执行逆行初等变换,得到逆矩阵
在这里插入图片描述
(3) 利用逆矩阵 P − 1 P^{-1} P1的前 r r r列构造矩阵 F F F
(4) 书写满秩分解结果 A = F G A=FG A=FG

(2)中的逆行初等变换如下:

  • i i i行和第 j j j行的互换 R i ↔ R j R_i↔R_j RiRj,的逆变换是 R j ↔ R i R_j↔R_i RjRi.
  • 初等行变换 a R i aR_i aRi的逆变换为 a − 1 R a^{-1}R a1R
  • 初等行变换 R i + a R j R_i+aR_j Ri+aRj的逆变换为 R i − a R j R_i-aR_j RiaRj.

一旦获得矩阵 A m × n A_{m\times n} Am×n的满秩分解后,即可根据下面的引理求出 A A A的广义逆矩阵 A − 1 A^{-1} A1

引理1
若矩阵 A m × n A_{m\times n} Am×n,具有秩 r r r,且其满秩分解为 A = F G A=FG A=FG,其中, F m × r F_{m\times r} Fm×r为满列秩; G r × n G_{r\times n} Gr×n为满行秩,则
A − = G T ( F T A G T ) − 1 F T A^-=G^T(F^TAG^T)^{-1}F^T A=GT(FTAGT)1FT
A A A的一个广义逆矩阵。

算法2(广义逆矩阵的计算)
(1) 计算矩阵 A m × n A_{m\times n} Am×n的满秩分解 A = F G A=FG A=FG
(2) 求广义逆矩阵 A − = G T ( F T A G T ) − 1 F T A^-=G^T(F^TAG^T)^{-1}F^T A=GT(FTAGT)1FT

下面是广义逆矩阵的递推计算公式。
(1) 令 A A A是一个 m × n m \times n m×n矩阵, u u u v v v分别是 m × 1 m\times 1 m×1 n × 1 n\times 1 n×1向量,则
( A + u v T ) − = A − ( A − u ) ( v T A − ) 1 + v T A − u (A+uv^T)^-=A^-\frac{(A^-u)(v^TA^-)}{1+v^TA^-u} (A+uvT)=A1+vTAu(Au)(vTA)
其中,假定 v T A − u ≠ − 1 v^TA^-u≠-1 vTAu=1
(2)分块矩阵的广义逆矩阵的计算公式

M = [ A C C H B ] M= \begin{bmatrix} A & C \\ C^H & B \end{bmatrix} M=[ACHCB]
式中, A = X 1 H X 1 , B = X 2 H X 2 , C = X 1 H X 2 A=X_1^HX_1,B=X_2^HX_2,C=X_1^HX_2 A=X1HX1,B=X2HX2,C=X1HX2
D = B − C H A − C D=B-C^HA^-C D=BCHAC,则
M − = [ A − + A − C D − C H A − − A − C D − − D − C H A − D − ] M^-= \begin{bmatrix} A^-+A^-CD^-C^HA^- & -A^-CD^- \\ -D^-C^HA^- & D^- \end{bmatrix} M=[A+ACDCHADCHAACDD]

2. 一致方程的最小范数解

举一个简单的例子,假定线性方程为
x 1 + 2 x 2 = 10 x_1+2x_2=10 x1+2x2=10
这显然是一个一致方程

如下图所示,直线 x 1 + 2 x 2 = 10 x_1+2x_2=10 x1+2x2=10上的所有点 ( x 1 , x 2 ) (x_1,x_2) (x1,x2)都是方程的解即通解
如果希望确定唯一的解,就必须增加某个约束条件,求满足该条件的唯一解。作为约束条件,这里要求得到的解的范数为最小。这样得出的唯一解称为最小范数解
由于 x x x的范数最小等同非向量 x x x的端点与原点的距离最小,故最小范数解也称最短距离解
在本例中,“与原点的距离最短的解”为(2,4),见下图。
在这里插入图片描述
下面讨论一般情况下线性方程 A x = y Ax=y Ax=y的最小范数解。先讨论其通解。
定理1
n × m n\times m n×m矩阵 A − A^- A m × n m\times n m×n矩阵 A A A的任意一个广义逆矩阵,则
(1) 齐次方程 A x = 0 Ax=0 Ax=0的一个通解为 x = ( I − A − A ) z x=(I-A^-A)z x=(IAA)z,其中, z z z n × 1 n\times 1 n×1任意向量。

(2) 非齐次方程 A x = y Ax=y Ax=y为一致方程的充分必要条件
A A − y = y AA^-y=y AAy=y
(3) 非齐次方程 A x = y Ax=y Ax=y的一个通解为
x = A − y + ( I − A − A ) z x=A^-y+(I-A^-A)z x=Ay+(IAA)z
式中, z z z n × 1 n\times 1 n×1任意向量。

由于对一个一致方程 A x = y Ax=y Ax=y,存在着通解公式,一个令我们感兴趣的问题是:是否存在一个 y y y无关的广义逆矩阵 G G G选择,使得解 G y Gy Gy在所有的解中具有最小范数?换言之,如果广义逆矩阵 G G G存在的话,我们希望它满足条件
min ⁡ A x = y ∣ ∣ x ∣ ∣ = ∣ ∣ G y ∣ ∣ \min_{Ax=y}||x||=||Gy|| Ax=ymin∣∣x∣∣=∣∣Gy∣∣
如果上式满足,则称 G y Gy Gy为线性一致方程 A x = y Ax=y Ax=y的最小范数解,并称广义逆矩阵 G G G最小范数广义逆矩阵

考虑矩阵 A m × n A_{m\times n} Am×n和向量 x n × 1 y m × 1 x_{n\times 1}y_{m\times 1} xn×1ym×1。于是, < A x , y > <Ax,y> <Ax,y> m m m阶向量空间的内积,记作 < A x , y > m <Ax,y>_m <Ax,y>m。矩阵 A m × n A_{m\times n} Am×n的伴随矩阵用符号 A # A^\# A#表示,定义为将 m m m阶向量空间的内积等价变换 n n n阶向量的内积的一个映射,即有
< A x , y > m = < x , A # y > n <Ax,y>_m=<x,A^\#y>_n <Ax,y>m=<x,A#y>n
特别地,若 A # = A A^\#=A A#=A,则称 A A A自伴随矩阵。显然,自伴随矩阵一定是正方矩阵

伴随矩阵具有以下性质:

(1) ( A # ) # = A (A^\#)^\# = A (A#)#=A
(2) ( A B ) # = B # A # (AB)^\#=B^\#A^\# (AB)#=B#A#
(3) < A x , B y > = 0 , ∀ x , y ↔ A # B = O <Ax,By>=0,\forall x,y \leftrightarrow A^\#B=O <Ax,By>=0,x,yA#B=O
(4) A # = A T A^\#=A^T A#=AT(若 A A A为实矩阵)或 A # = A A^\#=A A#=A(若 A A A为复矩阵)。

定理2
G y Gy Gy是一致方程 A x = y Ax=y Ax=y的最小范数解,当且仅当
A G A = A , ( G A ) # = G A AGA=A, (GA)^\#=GA AGA=A,(GA)#=GA

关于最小范数解,有以下两点注释:
注释1 充分必要条件 A G A = A , ( G A ) # = G A AGA=A,(GA)^\#=GA AGA=A,(GA)#=GA可以等价写作 G A A # = − A # GAA^\#=-A^\# GAA#=A#

注释2 最小范数解是唯一的,虽然最小范数广义逆矩阵 G G G有可能不唯一。

特别地,我们来讨论当 A m × n A_{m\times n} Am×n具有满行秩 m m m时,线性方程 A x = y Ax=y Ax=y的最小范数解。由于 A A A满行秩,故增广矩阵 [ A , y ] [A,y] [A,y]的秩与 A A A的秩相同,即线性方程 A x = y Ax=y Ax=y是一致方程。另一方面,矩阵乘积 A A H AA^H AAH 可逆,故存在右伪逆矩阵 A H ( A A H ) − 1 A^H(AA^H)^{-1} AH(AAH)1。与之对应的解为
x ° = A H ( A A H ) − 1 y x^°=A^H(AA^H)^{-1}y x°=AH(AAH)1y

3. 非一致方程的最小二乘解

考虑非一致方程 A x = y Ax=y Ax=y的求解。由于是非一致方程,故不存在严格满足方程的解。
换言之,非一致方程只能够有近似解。因此,我们很自然地希望寻找一个使得方程两边的误差平方和为最小的解。这样一种解称为非一致方程的最小二乘解。具体说来,若用 x ^ \widehat{x} x 代表最小二乘解,则它应该满足
∣ ∣ A x ^ − y ∣ ∣ = inf ⁡ x ∣ ∣ A x − y ∣ ∣ ||A\widehat{x}-y||=\inf_x||Ax-y|| ∣∣Ax y∣∣=xinf∣∣Axy∣∣
式中, i n f inf inf表示函数的下确界。
定理1
G G G是某个矩阵,则 x ^ = G y \widehat{x}=Gy x =Gy是非一致方程 A x = y Ax=y Ax=y的最小二乘解当且仅当
A # A G = A # A^\#AG=A^\# A#AG=A#
或者等价为
A G A = A , ( A G ) # = A G AGA=A,(AG)^\#=AG AGA=A,(AG)#=AG
关于非一致方程的最小二乘解,有下面的两点注释:
注释1 非一致方程的最小二乘解有可能不是唯一的,但是不同的最小二乘解得到的 A x Ax Ax A x − y Ax-y Axy是唯一的。
注释2 非一致方程 A x = y Ax=y Ax=y的最小二乘解的通解形式火
x ^ = G y + ( I − G A ) z , z 任意 \widehat{x}=Gy+(I-GA)z,z任意 x =Gy+(IGA)zz任意

考虑非一致方程 A x = y Ax=y Ax=y的矩阵 A A A具有满列秩的特殊情况。此时,矩阵乘积 A H A A^HA AHA非奇异。
下面证明,解
x ° = ( A H A ) − 1 A H y x°=(A^HA)^{-1}A^Hy x°=(AHA)1AHy
就是一个最小二乘解。

x x x是任何其他一个解,易知
∣ ∣ A x − y ∣ ∣ 2 = ∣ ∣ A ( x − x ° ) + A x ° − y ∣ ∣ 2 ||Ax-y||^2=||A(x-x°)+ Ax°-y||^2 ∣∣Axy2=∣∣A(xx°)+Ax°y2
= ∣ ∣ A ( x − x ° ) + [ A ( A H A ) − 1 A H − I m ] y ∣ ∣ 2 =||A(x-x°)+ [A(A^HA)^{-1}A^H - I_m]y||^{2} =∣∣A(xx°)+[A(AHA)1AHIm]y2
= ∣ ∣ A ( x − x ° ) ∣ ∣ 2 + ∣ ∣ [ A ( A H A ) − 1 A H − I m ] y ∣ ∣ 2 + 2 [ A ( x − x ° ) ] H [ A ( A H A ) − 1 A H − I m ] y = ||A(x - x°)||^2 + ||[A(A^HA)^{-1}A^H - I_m]y||^2+2[A(x-x°)]^H[A(A^H A)^{-1}A^H-I_m]y =∣∣A(xx°)2+∣∣[A(AHA)1AHIm]y2+2[A(xx°)]H[A(AHA)1AHIm]y
但是最后一个等式的第三项等于零,即
[ A ( x − x ° ) ] H [ A ( A H A ) − 1 A H − I m ] y [A(x-x°)]^H[A(A^HA)^{-1}A^H-I_m]y [A(xx°)]H[A(AHA)1AHIm]y
= ( x − x ° ) H [ A H A ( A H A ) − 1 A H − A H ] y = (x -x°)^H[A^HA(A^HA)^{-1}A^H-A^H]y =(xx°)H[AHA(AHA)1AHAH]y
= ( x − x ° ) H ( A H − A H ) y = 0 =(x-x°)^H(A^H-A^H)y =0 =(xx°)H(AHAH)y=0
因此,上简化为
∣ ∣ A x − y ∣ ∣ 2 = ∣ ∣ A ( x − x ° ) ∣ ∣ 2 + ∣ ∣ A ( A H A ) − 1 A H y − y ∣ ∣ 2 ||Ax -y||^2 =|| A(x -x°)||^2 + ||A(A^HA)^{-1}A^Hy - y||^2 ∣∣Axy2=∣∣A(xx°)2+∣∣A(AHA)1AHyy2
= ∣ ∣ A ( x − x ° ) ∣ ∣ 2 + ∣ ∣ A x ° − y ∣ ∣ 2 = ||A(x - x°)||^2 + || Ax° - y||^2 =∣∣A(xx°)2+∣∣Ax°y2
由于 ∣ ∣ A ( x − x ° ) ∣ ∣ 2 > 0 ||A(x - x°)||^2>0 ∣∣A(xx°)2>0,故:
∣ ∣ A x − y ∣ ∣ 2 ≥ ∣ ∣ A x ° − y ∣ ∣ 2 , ∀ x , y ||Ax-y||^2≥ ||Ax° -y||^2, \forall x,y ∣∣Axy2∣∣Ax°y2,x,y
即是说, x ° x° x°确实是矩阵 A A A满列秩时,非一致方程 A x = y Ax=y Ax=y的一个最小二乘解。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值