矩阵分解、奇异值分解（SVD）

最新推荐文章于 2023-08-27 19:19:10 发布

原创最新推荐文章于 2023-08-27 19:19:10 发布 · 670 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #线性代数

基础学习专栏收录该内容

10 篇文章

订阅专栏

本文深入解析特征值与特征向量的几何意义，介绍方阵分解原理，并详细阐述奇异值分解(SVD)的过程与应用，特别是在数据降维方面的关键作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.特征值

特征向量 $Ax=λxAx=\lambda x$ 的几何意义：向量x通过矩阵A变换，只进行缩放，而不改变向量方向，缩放倍数即特征值。
对于n阶方阵，一定有n个特征值（包括复数），但非零特征值个数等于矩阵的秩。

2.方阵的分解

根据 $Ax=λxAx=\lambda x$ , 对于n阶方阵： $U\Sigma U^{-1}$ 其中U为n个特征向量构成的矩阵， $Σ\Sigma$ 为特征值构成的对角阵。把U的n个特征向量标准化，满足 $U^{-1}=U^T$ ，得到 $U\Sigma ' U^{T}$

3. 奇异值分解

当A不是方阵时，需要奇异值分解了（Singular Value Decompasition, SVD）, 分解得到 $A=UΣVTA=U\Sigma V^T$ , 其中U,V分别为m,n阶方阵， $Σ\Sigma$ 为m x n维矩阵，主对角线上非零元素为奇异值。分解过程如下：

对于矩阵 $\left(\begin{matrix}0&1\\ 1&1\\1&0\end{matrix} \right)$

求出 $AA^T$ 、 $A^TA$
$AAT=(2112)AA^T = \left(\begin{matrix}2&1\\ 1&2\end{matrix} \right)$ 、 $AAT=(110121011)AA^T = \left(\begin{matrix}1&1&0\\ 1&2&1\\0&1&1\end{matrix} \right)$
对两者分别求特征值与特征向量，使得 $ATAvi=λiviA^TAv_i=\lambda_i v_i$ $AATui=λiuiAA^Tu_i=\lambda_i u_i$ 得到： $λi=3,λ2=1,v1=(1/21/2)T,v2=(−1/21/2)T\lambda_i=3,\lambda_2=1,v_1=(1/\sqrt2 1/\sqrt2)^T, v_2=(-1/\sqrt2 1/\sqrt2)^T$ $u1=(1/6,2/6,1/6)T,u2=(1/2,0,−1/2)Tu_1=(1/\sqrt6,2/\sqrt6,1/\sqrt6)^T, u_2=(1/\sqrt2,0,-1/\sqrt2)^T$ $λ3=0,u3=(1/3,−1/3,1/3)T\lambda_3=0, u_3=(1/\sqrt3,-1/\sqrt3,1/\sqrt3)^T$
利用 $Avi=σiuiAv_i=\sigma_iu_i$ 求奇异值, $σ1=3,σ2=1\sigma_1=\sqrt3, \sigma_2=1$ .
得到分解结果:
$A=UΣVT=(1/61/21/32/60−1/31/6−1/21/3)(300100)(1/21/2−1/21/2)A=U\Sigma V^T= \left(\begin{matrix} 1/\sqrt6 & 1/\sqrt2 & 1/\sqrt3 \\ 2/\sqrt6 & 0 & -1/\sqrt3 \\ 1/\sqrt6 & -1/\sqrt2 & 1/\sqrt3 \end{matrix} \right)\left(\begin{matrix} \sqrt3 & 0\\ 0& 1 \\ 0 & 0 \end{matrix} \right)\left(\begin{matrix} 1/\sqrt2 & 1/\sqrt2\\ -1/\sqrt2 & 1/\sqrt2 \end{matrix} \right)$

4.奇异值分解的作用：降维

Python中奇异值分解：

U,sigma,VT=linalg.svd(data)

分解后，得到sigma为奇异值从大到小排列的向量，通过 $su(sigma[:k])2sum(sigma)2\frac{su(sigma[:k])^2}{sum(sigma)^2}$ 计算奇异值的能量占比，一般超过80%则表明保留了较多信息，可以用前k个分量还原出原矩阵的大部分信息，从而将原矩阵降维到m x k维。