定理1.2.3 (von Neumann引理)
设 E∈Rn×n,I∈Rn×nE\in \mathbb R^{n\times n},I \in \mathbb R^{n\times n}E∈Rn×n,I∈Rn×n 是单位矩阵, ∥⋅∥\Vert \cdot \Vert∥⋅∥ 是满足 ∥⋅∥=1\Vert \cdot \Vert=1∥⋅∥=1 (对于诱导矩阵范数,我们总有∥I∥=1\Vert I \Vert=1∥I∥=1)的相容矩阵范数(诱导 p-范数和 Frobenius范数满足相容性条件,而Frobenius范数不满足∥⋅∥=1\Vert \cdot \Vert=1∥⋅∥=1条件)。如果 ∥E∥<1\Vert E \Vert\lt1∥E∥<1,则 (I−E)(I-E)(I−E) 是非奇异矩阵(即,满秩,对应的行列式不为0),且:
(I−E)−1=∑k=0∞Ek(1.2.19a).∥(I−E)−1∥≤11−∥E∥(1.2.19b)
(I-E)^{-1}=\sum_{k=0}^{\infty} E^k\qquad(1.2.19a)\\ . \\
\Vert (I-E)^{-1} \Vert\le \frac{1}{1-\Vert E \Vert} \qquad(1.2.19b)
(I−E)−1=k=0∑∞Ek(1.2.19a).∥(I−E)−1∥≤1−∥E∥1(1.2.19b)
证明:
因为∥E∥<1\Vert E\Vert \lt 1∥E∥<1,故:
Sk=I+E+E2+⋯+Ek
S_k=I+E+E^2+\cdots+E^k
Sk=I+E+E2+⋯+Ek
定义一个Cauchy序列,因而收敛,即:
∑k=0∞Ek=limk→∞Sk=(I−E)−1
\sum_{k=0}^{\infty}E^k=\lim_{k\to\infty}S_k=(I-E)^{-1}
k=0∑∞Ek=k→∞limSk=(I−E)−1
又:
∥(I−E)−1∥=∣∣∑k=0∞Ek∣∣≤∑k=0∞∥Ek∥≤∑k=0∞∥E∥k=11−∥E∥
\Vert (I-E)^{-1} \Vert =\left|\left| \sum_{k=0}^{\infty}E^k\right| \right| \le \sum_{k=0}^{\infty} \Vert E^k \Vert \le \sum_{k=0}^{\infty} \Vert E \Vert^k=\frac{1}{1-\Vert E\Vert}
∥(I−E)−1∥=∣∣∣∣∣∣∣∣∣∣k=0∑∞Ek∣∣∣∣∣∣∣∣∣∣≤k=0∑∞∥Ek∥≤k=0∑∞∥E∥k=1−∥E∥1
证毕。
由von Neumann引理有:
如果 A 非奇异,∥A−1(B−A)∥<1\Vert A^{-1}(B-A)\Vert \lt 1∥A−1(B−A)∥<1,则B非奇异,且:
B−1=∑k=0∞(I−A−1B)kA−1(1.2.20)∥B−1∥≤∥A−1∥1−∥A−1(B−A)∥(1.2.21)
B^{-1}=\sum_{k=0}^{\infty}(I-A^{-1}B)^kA^{-1}\qquad(1.2.20)\\
\Vert B^{-1}\Vert \le \frac{\Vert A^{-1}\Vert}{1-\Vert A^{-1}(B-A)\Vert} \qquad(1.2.21)
B−1=k=0∑∞(I−A−1B)kA−1(1.2.20)∥B−1∥≤1−∥A−1(B−A)∥∥A−1∥(1.2.21)
这个定理表明,若B充分接近于一个可逆矩阵A,则B也可逆
,上述定理也可以表示成以下形式:
定理 1.2.3‘:
设 A,B∈Rn×nA,B\in \mathbb R^{n\times n}A,B∈Rn×n,AAA 可逆,A−1≤αA^{-1}\le \alphaA−1≤α,如果 ∥A−B∥≤β,αβ<1\Vert A-B\Vert\le \beta,\alpha\beta\lt 1∥A−B∥≤β,αβ<1,则 BBB 可逆,且:
∥B−1∥≤α1−αβ
\Vert B^{-1} \Vert \le \frac{\alpha}{1-\alpha\beta}
∥B−1∥≤1−αβα
设 LLL 和 MMM 是 RnR^nRn 的子空间,若 RnR^nRn 可称为 LLL 和 MMM 的直和
(表示为:Rn=L⊕MR^n=L\oplus MRn=L⊕M),当且仅当:
- Rn=L+MR^n=L+MRn=L+M
- L∩M={0}L\cap M=\{0\}L∩M={0}
设 Rn=L⊕MR^n=L\oplus MRn=L⊕M,如果线性算子 P:Rn→RnP:R^n\to R^nP:Rn→Rn 满足
Py=y,∀y∈L,Pz=0,∀z∈M Py=y,\forall y \in L,\\Pz=0,\forall z\in M Py=y,∀y∈L,Pz=0,∀z∈M
则称 PPP 是从 RnR^nRn 沿子空间 MMM 到子空间 LLL 上的投影算子,记作 PL,MP_{L,M}PL,M 或 PPP。
如果 M=L⊥M=L^{\bot }M=L⊥,则上述投影算子称为直交投影算子,记为 PLP_LPL 或 PPP。
设 Cm×nC^{m\times n}Cm×n 是所有复 m×nm\times nm×n 组成的集合,A∗A^*A∗ 表示 AAA 的共轭转置
。
设 A∈Cm×nA\in C^{m\times n}A∈Cm×n,则 AAA 的 Moore-Penrose 广义逆
定义为 A+∈Cn×mA^+ \in C^{n\times m}A+∈Cn×m,它满足:
AA+A=A,A+AA+=A+,(AA+)∗=AA+,(A+A)∗=A+A(1.2.22)
AA^+A=A,A^+AA^+=A^+,(AA^+)^*=AA^+,(A^+A)^*=A^+A\qquad(1.2.22)
AA+A=A,A+AA+=A+,(AA+)∗=AA+,(A+A)∗=A+A(1.2.22)
如果 A∈Crm×nA\in C_r^{m\times n}A∈Crm×n 的直交分解是:
A=Q∗RP(1.2.24)
A=Q^*RP \qquad(1.2.24)
A=Q∗RP(1.2.24)
其中,QQQ 和 PPP 分别是 m×mm\times mm×m 和 n×nn\times nn×n 酉矩阵。所谓“酉矩阵”,是指n阶复方阵U的n个列向量是U空间上的一个标准正交基,则U是酉矩阵(Unitary Matrix),它是正交矩阵在复数域的推广。
上式的R,有 R∈Cm×nR\in C^{m\times n}R∈Cm×n,
R=[R11000]
R =\left[ \begin{array}{cc}R_{11} & 0 \\
0 & 0
\end{array} \right]
R=[R11000]
其中,R11R_{11}R11 是 r×rr\times rr×r 非奇异上三角矩阵,于是,
A+=P∗R+Q
A^+=P^*R^+Q
A+=P∗R+Q
其中:
R+=[R11−1000]
R^+ =\left[ \begin{array}{cc}R_{11}^{-1} & 0 \\
0 & 0
\end{array} \right]
R+=[R11−1000]
类似的,如果 A∈Crm×nA\in C_r^{m\times n}A∈Crm×n 的奇异值分解是:
A=UDV∗(1.2.26) A=UDV^*\qquad(1.2.26) A=UDV∗(1.2.26)
其中,UUU 和 VVV 分别是 m×mm\times mm×m 和 n×nn \times nn×n 酉矩阵,
D=[Σ000]∈Cm×n
D =\left[ \begin{array}{cc}\Sigma & 0 \\
0 & 0
\end{array} \right]\in C^{m\times n}
D=[Σ000]∈Cm×n
其中,Σ=diag(σ1,⋯ ,σr)\Sigma =diag(\sigma_1,\cdots,\sigma_r)Σ=diag(σ1,⋯,σr),σi>0\sigma_i \gt 0σi>0 是 AAA 的非零奇异值,则:
A+=VD+U∗(1.2.26) A^+=VD^+U^*\qquad(1.2.26) A+=VD+U∗(1.2.26)
其中,
D+=[Σ−1000]∈Cm×n
D^+ =\left[ \begin{array}{cc}\Sigma^{-1} & 0 \\
0 & 0
\end{array} \right]\in C^{m\times n}
D+=[Σ−1000]∈Cm×n
由此看来,奇异值分解是正交分解的一个特例
。