背景
当 A A A为满秩方阵时,方程 A x = b Ax=b Ax=b有解 x = A − 1 b x=A^{-1}b x=A−1b
当 A A A不为满秩方阵时,方程无解,但是我们希望求得近似解 x ′ = arg min ∥ A x − b ∥ = A + b x'=\argmin\|Ax-b\|=A^+b x′=argmin∥Ax−b∥=A+b,其中 A + A^+ A+为伪逆矩阵
行/列满秩的情形
列满秩
当 A A A为列满秩矩阵时, A T A A^TA ATA可逆, A T ( A x − b ) = 0 ⟺ A T A x = A T b A^T(Ax-b)=0\iff A^TAx=A^Tb AT(Ax−b)=0⟺ATAx=ATb有唯一解 x = ( A T A ) − 1 A T b x=(A^TA)^{-1}A^Tb x=(ATA)−1ATb,伪逆矩阵为 A + = ( A T A ) − 1 A T A^+=(A^TA)^{-1}A^T A+=(ATA)−1AT
行满秩
这其实是列满秩的对偶情形,把“矩阵左乘列向量”调换为“矩阵右乘行向量”(如果想要几何理解,那就同时把几何意义也迁移过来),推导如上:
欲求
x ′ = arg min x ∥ x T A − b T ∥ x'=\argmin_x\|x^TA-b^T\| x′=xargmin∥xTA−bT∥
这样的 x x x满足
( x T A − b T ) A T = 0 (x^TA-b^T)A^T=0 (xTA−bT)AT=0
解得
x T = b T A T ( A A T ) − 1 x^T=b^TA^T(AA^T)^{-1} xT=bTAT(AAT)−1
因此伪逆矩阵为
A + = A T ( A A T ) − 1 A^+=A^T(AA^T)^{-1} A+=AT(AAT)−1
一般矩阵的情形
满秩分解表示
A T ( A x − b ) = 0 ⟺ A T A x = A T b A^T(Ax-b)=0\iff A^TAx=A^Tb AT(Ax−