LLE MDS FastMap ISOMAP
SVD
奇异值分解 Singual Value Decomposition,简称SVD
如果一个nnn阶方阵AAA相似于对角矩阵,也就是,如果存在一个可逆矩阵PPP,使得P−1APP^{-1}APP−1AP是对角矩阵,则称矩阵AAA为可对角化矩阵,并且最终对角对角矩阵的特征值就是矩阵AAA的特征值
可逆矩阵PPP是AAA的全部特征向量按列构成的矩阵
设AAA是数域上的一个nnn阶方阵,若在相同的数域上存在另一个nnn阶方阵BBB,使得AB=BA=EAB=BA=EAB=BA=E,那么称BBB为AAA的逆矩阵,而AAA被称为可逆矩阵或非奇异矩阵。如果AAA不存在逆矩阵,那么AAA称为奇异矩阵
A=WΣW−1A=W\Sigma W^{-1}A=WΣW−1
其中WWW是这nnn个特征向量所组成的n×nn \times nn×n维矩阵,而Σ\SigmaΣ为这nnn个特征值为主对角线的n×nn \times nn×n维矩阵。
一般会把WWW的这nnn个特征向量标准话,即满足∣∣wi∣∣2=1||w_i||_2=1∣∣wi∣∣2=1,或者wiTwi=1w_i^Tw_i=1wiTwi=1,此时WWW的nnn个特征向量为标准正交基,满足WTW=EW^TW=EWTW=E,即WT=W−1W^T=W^{-1}WT=W−1,也就是说WWW为酉矩阵。
这样特征分解表达式可以写成
A=WΣWTA=W\Sigma W^TA=WΣWT
要进行特征分解,矩阵AAA必须为方阵,那么如果AAA不是方阵,即行和列不相同时,还可以对矩阵进行分解吗?答案是可以,这就是SVD解决的问题
假设矩阵AAA是一个m×nm\times nm×n的矩阵,那么定义矩阵AAA的SVD为:
A=UΣVTA=U\Sigma V^TA=UΣVT
其中UUU是一个m×mm \times mm×m的矩阵,Σ\SigmaΣ 是一个m×nm \times nm×n的矩阵,除了主对角线上的元素以外全为0,主对角线上的每个元素都称为奇异值,VVV是一个n×nn \times nn×n的矩阵。UUU和VVV都是酉矩阵,即满足
UTU=E VTV=EU^TU=E\\ ~ \\ V^TV=EUTU=E VTV=E
如何求出SVD分解后的U,Σ,VU,\Sigma,VU,Σ,V这三个矩阵呢?
将AAA的转置和AAA做乘法,那么会得到n×nn \times nn×n的一个方阵ATAA^TAATA。既然ATAA^TAATA是方阵,就可以进行特征分解,得到的特征值和特征向量满足下式:
(ATA)vi=λivi(A^TA)v_i = \lambda_iv_i(ATA)vi=λivi
这样就可以得到矩阵ATAA^TAATA的nnn个特征值和对应的nnn个特征向量vvv了,将ATAA^TAATA的所有特征向量组成一个n×nn \times nn×n的矩阵VVV,就是SVD公式里面的VVV矩阵,一般将VVV中的每个特征向量叫做AAA的右奇异向量
将AAA和AAA的转置做矩阵乘法,那么会得到m×mm \times mm×m的一个方阵ATAA^TAATA,既然ATAA^TAATA是方阵,就可以进行特征分解,得到的特征值和特征向量满足下式:
(ATA)ui=λiui(A^TA)u_i = \lambda_iu_i(ATA)ui=λiui
这样就可以得到矩阵ATAA^TAATA的mmm个特征值和对应的mmm个特征向量uuu了,将ATAA^TAATA的所有特征向量组成一个m×mm \times mm×m的矩阵UUU,就是SVD公式里面的UUU矩阵,一般将VVV中的每个特征向量叫做AAA的左奇异向量
A=WΣWT AV=UΣVTV AV=UΣ Avi=σiuiA=W\Sigma W^T \\ ~ \\ AV=U\Sigma V^TV \\ ~ \\ AV=U\Sigma \\ ~ \\ Av_i = \sigma_iu_i A=WΣWT AV=UΣVTV AV=UΣ Avi=σiui
本文介绍了奇异值分解(SVD)的概念,包括SVD的定义、矩阵的特征分解和奇异值的求解过程。强调了SVD在非方阵情况下的应用,解释了U、Σ、V矩阵的性质及其在特征向量和奇异值中的角色。
737

被折叠的 条评论
为什么被折叠?



