矩阵论笔记(八)——矩阵分解

本文详述了矩阵分解的重要类型,包括LU分解、QR分解、满秩分解和SVD(奇异值分解)。LU分解通过下三角和上三角矩阵实现,适用于线性方程组求解。QR分解利用正交矩阵和上三角矩阵,广泛应用于线性最小二乘问题。满秩分解将矩阵分为列满秩和行满秩矩阵的乘积。SVD则对任意非零矩阵进行奇异值分解,具有多种应用。每种分解都有其特定的条件、算法和唯一性讨论。

主要包括以下几种分解:

  • LU 分解(三角分解)
  • QR 分解(正交三角分解)
  • 满秩分解
  • SVD 分解(奇异值分解)

分别简介如下:

  • LU 分解

    • 简介:把方阵分解为下三角矩阵与上三角矩阵的乘积 A=LU
    • 条件:A 的前 1n1 阶顺序主子式非零,则存在唯一分解 A=LDU
    • 算法:① Gauss 消元法,② Crout 分解,③ Doolittle 分解;
    • 推论:实对称正定矩阵有 Cholesky 分解 A=GGTA=LDU=LD̃ 2U,由 AT=AL=UT,U=LT);
    • 唯一性:唯一。
  • QR 分解

    • 简介:把方阵分解为酉矩阵与上三角矩阵的乘积 A=QR
    • 条件:A 为实/复非奇异矩阵;
    • 算法:① Schmidt 正交化;② Givens 变换;③ Householder 变换;
    • 唯一性:除去相差一个对角元素的绝对值(模)全为 1 的对角阵外,分解式唯一;
    • 推广:若 ACm×nnn 个列线性无关,则有分解 A=QR 满足 QCm×n, QHQ=IRn 阶非奇异上三角矩阵,且除去模 1 对角阵外,该分解式唯一。
  • 满秩分解

    • 简介:把任意非零矩阵分解为列满秩矩阵与行满秩矩阵的乘积 A=FG
    • 条件:任意非零矩阵 ACm×nr (r>0)
    • 算法:① 初等行变换+初等阵求逆;② 初等行变换为 Hermite 标准形+列置换矩阵;
    • 唯一性:不唯一。
  • SVD 分解

    • 简介:把任意非零矩阵分解为 A=UDV 的形式,其中 U,Vm 阶和 n 阶酉矩阵,D=ΣOOO,其中 Σ=diag(σ1,,σr),而 σiA 的全部非零奇异值;
    • 条件:任意非零矩阵;
    • 算法:步骤 ① 对 AHA 求谱分解得 V,Σ2,② U1=AV1Σ1,③ 构造 U2(解方程 U1x=0);
    • 唯一性:不唯一。

以下详细讲解。

1 LU 分解

求解线性方程组时,用初等行变换把系数化为上三角形式,这个过程可以用矩阵表示出来。

定理

(1)定理一:设 An 阶矩阵,当且仅当(充要条件)A 的顺序主子式 Δk0, k=1,,n1 时,A唯一地被分解为 A=LDU,其中 L,U 分别是单位下三角阵和单位上三角阵(对角元素为 1),D=diag(d1,,dn)dk=ΔkΔk1
(2)推论一:n 阶非奇异矩阵 A 有三角分解 A=LU 的充要条件是其顺序主子式 Δk0, k=1,,n1
(3)定理二:对任意非奇异矩阵 A,存在置换矩阵 P 使 PAn 个顺序主子式非零;
(4)推论二:对非奇异矩阵 A,存在置换矩阵 P 使 PA=LÛ =LDU(三角分解)。

算法

(1)初等变换法:[A|I]r[U|P], [P|I]=[I|P1],并令 L=P1,注意初等变换时要保持 P 为下三角阵。

(2)Gauss 消元法:
   ① 用倍加初等阵 L11 左乘 A 化其第一列为只有第一个元素非零;
   ② 用 L12 左乘 A(1) 化其第二列为只有前两个元素非零;
   ③ 继续直至 A 被化为上三角阵;
   ④ 令 L=L1Ln1,则 A=LU

(3)Crout 分解:A=(LD)U=L̂ U,其中 U 为单位上三角阵,则:
   ① 计算 L̂  第一列:li1=ai1
   ② 计算 U 第一行:u1j=a1jl11
   ③ 计算 L̂  第二列:lik=aik(li1u1k++li,k1uk1k)
   ④ 计算 U 第二行:ukj=1lkk[akj(lk1u1j++lk,k1uk1,j)]
   ⑤ 继续下去,直到全部未知量计算完毕。

(4)Doolittle 分解:A=L(DU)=LÛ ,其中 L 为单位下三角阵。完全与 Crout 类似,有:
   ① uik=aiki1r=1lirurk
   ② lki=1uii(akii1r=1lkruri)

(5)Cholesky 分解:对实对称正定矩阵A=LDU=LD̃ 2U=GGT,其中 G=LD̃  是下三角矩阵。由对应关系可得:
   ① aij=gi1gj1++gijgjj (i>j)
   ② aii=g2i1++g2ii
   ③ 于是有递推公式:
      gij=(aiii1k=1g2ik)1/21gjj(aijj1k=1gikgjk)0(i=j)(i>j)(i<j)
      例如三阶矩阵的计算顺序为:g11,g21,g22,g31,g32,g33

结论

(1)求解方程组:若方程组 Ax=bA 非奇异且 Δk0,则存在三角分解 A=LU,于是便得通解两个方程组为 Ly=b, Ux=y

2 QR 分解

将矩阵分解为正交矩阵与上三角矩阵的积,也可以看成是 Schmidt 正交化的矩阵表示。经常用于线性最小二乘问题求解。

Givens 变换
  • 定义:

(1)Givens 变换(初等旋转变换,在 (ei,ej 平面内顺时针旋转 θ 角度)、Givens 矩阵(初等旋转矩阵 Tij(c,s),在 ei,ej 行列的值为 [c,s;s,c],其余行列同 I)。

  • 性质:

(1)正交阵:[Tij(c,s)]1=Tij(c,s)T=Tij(c,s)
(2)坐标的变化:ηi=cξi+sξj, ηj=sξi+cξj

  • 定理:

(1)旋转到 e1:存在有限个 Givens 矩阵的乘积,记为 T,使 Tx=|x|e1
(2)旋转到 z:存在有限个 Givens 矩阵的乘积,记为 T,使 Tx=|x|z,其中 z 为任意单位向量。

  • 计算:

(1)旋转到 0:取 c=ξiξ2i+ξ2j, s=ξjξ2i+ξ2j,就可使 ηi=ξ2i+ξ2j, ηj=0
(2)旋转到 e1:分别用 T12,T13,,T1nη2ηn 旋转到 0,于是 η1=ξ21++ξ2n=|x|
(3)旋转到任意单位向量 z:分别用 T1,T2x,z 旋转到 e1,则 T12T1 可把 x 旋转到 z

Householder 变换
  • 定义:

(1)Householder 变换(初等反射变换,把 x 映射到以 u 为法向量的超平面对面)、Householder 矩阵(H=I2uuT)。

  • 性质:

(1)对称矩阵:HT=H
(2)正交矩阵:HTH=I
(3)对合矩阵:H2=I
(4)自逆矩阵:H1=H
(5)detH=1(证:用到 det(Im+AB)=det(In+BA))。

  • 定理:

(1)反射到 z:存在 Householder 矩阵 H 使得 Hx=|x|z,其中 z 为任意单位向量;
(2)与 Givens 矩阵的关系:初等旋转矩阵是两个初等反射矩阵的乘积(注意反过来不成立,因为 detTij=1detH=1)。

  • 计算:

(1)反射到 zz 为单位列向量,要使 Hx=|x|z,取 u=x|x|z|x|x|z|(证:(I2uuT)x=|x|z,则 u(2uTx)=x|x|z,即 u=k(x|x|z),归一化即得)。

QR 分解
  • 定义:

(1)QR 分解(正交三角分解,针对非奇异矩阵,分解为正交阵乘以上三角阵,A=QR)。

  • 定理:

(1)唯一性:除去相差一个对角元素绝对值(模)全 1 的对角阵外,QR 分解式是唯一的;
(2)推广:Am×n 复矩阵,且其 n 个列向量线性无关,则有分解 A=QRQHQ=I,除去模 1 对角阵,唯一;
(3)Givens:任何 n 阶非奇异阵 A 可通过左连乘初等旋转矩阵化为非奇异上三角阵;
(4)Householder:任何 n 阶非奇异阵 A 可通过左连乘初等反射矩阵化为非奇异上三角阵。

  • 计算:

三种方法:① Schmidt 正交化,② Givens 变换,③ Householder 变换。

(1)Schmidt 正交化方法:把 A 标准正交化得到 Q,则 ① R=QTA 或者 ② 把 aiqi 表示,系数组成 R
(2)Givens 方法:用 T1A 第一列变成 e1,用 T2A 除首行首列的子矩阵第一列变成 e1,依次类推,则 T=diag(In2,Tn1)diag(1,T2)T1R=TA, Q=T1=TT);
(3)Householder 方法:同 Givens,用 H1A 第一列变成 e1,用 H2A 除首行首列的子矩阵第一列变成 e1,依次类推,则 S=diag(In2,Hn1)diag(1,H2)T1R=SA, Q=S1=ST)。

满秩分解

  • 定义

(1)满秩分解:任意非零 ACm×nr,若存在 FCm×rr, GCr×nr 使得 A=FG,则称该式为 A 的满秩分解(列满秩 x 行满秩);
(2)平凡分解:当 A 满秩时,可取一个因子为 I,另一个为 A 本身,该满秩分解称为平凡分解;
(3)Hermite 标准形:BCm×nr 为阶梯形,非零行第一个元素为 1,且第一个元素所在列的其他元素为 0,则称 B 为 Hermite 标准形;
(4)置换矩阵:P=(ej1,,ejn),其中 j1,,jn1,,n 的一个排列。

  • 定理

(1)定理一:任意非零 ACm×nr (r>0) 存在满秩分解 A=FG,其中 FCm×rr,GCrr×n
(2)定理二:设 A(初等行变换后)的 Hermite 标准形为 B,则满秩分解中,可取 FAj1,,jr 列构成的矩阵,GB 的前 r 行构成的矩阵。

  • 证明

(1)证明定理二:① 构建置换矩阵 P1 使 BP1=IrOB12O,② AP1=P1(BP1)=[F|S]IrOB12O =[F|FB12],③ 由上式知 FAP1 的前 r 列构成的矩阵,亦即 Aj1,,jr 列构成的矩阵。

  • 算法

(1)初等行变换:① [A|I]r[B|P],则 PA=B,② [P|I]r[I|P1],③ A=P1B=FG
(2)Hermite 标准形:① ArBB 为 Hermite 标准形,② FAj1,,jr 列,③ GB 的前 r 行。

4 SVD 分解

A 的奇异值分解,实际上就是对 AHA 的谱分解。

定义

(1)正交对角分解:非奇异矩阵 A,存在正交阵 P,Q 使 PTAQ=diag(σ1,,σn)σi>0
(2)奇异值:AHA 的特征值为 λi0,则 σi=λi 称为奇异值;
(3)奇异值分解:UHAV=ΣOOO,其中 U,V 为酉矩阵,Σ 为非零奇异值组成的对角阵;
(4)正交相抵:A,BRm×n,若存在 m 阶正交阵 U 和 n 阶正交阵 V 使 B=U1AV,则称 A,B 正交相抵。

定理

(1)定理一:对任意非奇异矩阵 ARn×n,存在正交矩阵 P,Q 使得 PTAQ=diag(σ1,,σn),其中 σi>0
(2)引用结论:① AHA 是 Hermite 矩阵,且其特征值为非负实数,② rank(AHA)=rankA,③ A=O 的充要条件是 AHA=O,④ A 的奇异值个数等于 A 的列数,A 的非零奇异值个数等于 rankA
(3)定理二:对任意非零矩阵 ACm×nr (r>0),存在 m 阶酉矩阵 U 和 n 阶酉矩阵 V 使得 UHAV=ΣOOO,其中 Σ=diag(σ1,,σr),而 σiA 的全部非零奇异值;
(4)结论二:U 的列向量是 AAH 的特征向量,V 的列向量是 AHA 的特征向量;
(5)定理三:N(A)=L(vr+1,,vn), R(A)=L(u1,,ur), A=σ1u1vH1+σrurvHr
(6)定理四:正交相抵矩阵具有相同的奇异值。

证明

(1)证明定理一:① A 非奇异,所以 ATA实对称正定矩阵矩阵,② 存在正交阵 Q 使 QT(ATA)Q=diag(λ1,,λn),③ 设 Λ=diag(σ1,,σn),其中 σi=(λi),则 QT(ATA)Q=Λ2,于是 (AQΛ1)TAQ=Λ,④ 令 P=AQΛ1,易证其为正交矩阵;
(2)证明定理二:对 AHA 进行谱分解,并按非零特征值对 V 分块,令 U1=AV1Σ1 并扩充为标准正交基 U 即得;
(3)证明结论二:注意到,由奇异值分解式可得,AAH=UΣ2OOOUH, AHA=VΣOOOVH
(4)证明定理三:① N(A)={x|Ax=0}={x|U1ΣVH1x=0}= {x|VH1x=0}= {x|x=kr+1vr+1++knvn}= L(vr+1,,vn),② R(A)={y|y=Ax}={y|y=U1(ΣVH1x)}R(U1), R(U1)={y|y=U1z}={y|y=A(V1Σ1z)}R(A),③ A=U1ΣVH1 直接可得;
(5)证明定理四:只需证 BTBATA 有相同的特征值,亦即证二者相似即可。

算法

步骤:

(1)求 AHAλ1λn, 单位正交向量组 α1αn
(2)V=[α1,,αn]σi=λi>0, i=1,,r, Σ=diag(σ1,,σr)
(3)U1=AV1Σ1
(4)把 U1 扩充为标准正交基 U(解方程 U1x=0),即得 A=UΣOOOVH

【未完成:分块矩阵的 LDU 分解,导出结论 det(Im+AB)=det(In+BA)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值