SVD(Singular Value Decomposition, 奇异值分解)数学证明

本文深入探讨了奇异值分解(SVD)的数学原理及其在机器学习和图像压缩中的应用。SVD是一种强大的线性代数工具,可以将任意矩阵分解为三个矩阵的乘积,从而实现数据压缩和特征提取。通过详细的数学证明,我们理解了SVD如何帮助我们节省存储空间,并提高了数据处理的效率。

奇异值分解(SVD)在机器学习、图像压缩中应用很多,使用它能够节省很多存储空间。这里主要从数学原理上阐述SVD的证明。

奇异值分解定义

对任意矩阵 A ∈ R m × n A \in R^{m\times n} ARm×n,存在正交矩阵 U ∈ R m × m , V ∈ R n × n U \in R^{m \times m}, V\in R^{n \times n} URm×m,VRn×n及除了主对角线上的元素以外全为0的矩阵 Σ ∈ R m × n \Sigma \in R^{m \times n} ΣRm×n,使得 A = U Σ V T A = U\Sigma V^{T} A=UΣVT,其中 Σ \Sigma Σ的主对角元上的元素满足 σ 11 ≥ σ 22 ≥ . . . ≥ σ k k , k = m i n ( m , n ) . \sigma_{11} \ge \sigma_{22} \ge...\ge \sigma_{kk}, k= min(m,n). σ11σ22...σkk,k=min(m,n).
其中称 σ i = λ i , i = 1 , 2 , . . . , r \sigma_i = \sqrt{\lambda_i}, i=1,2,...,r σi=λi ,i=1,2,...,r A A A奇异值 r r r A A A的秩且 λ 1 , λ 2 , . . . , λ r \lambda_1,\lambda_2,...,\lambda_r λ1,λ2,...,λr A T A A^{T}A ATA的非零特征值。

数学证明

因为 A T A A^{T}A ATA为实对称矩阵,所以存在正交矩阵 V V V使得 V T A T A V = d i a g ( λ 1 , . . . , λ n ) , V^{T}A^{T}AV=diag(\lambda_1,...,\lambda_n), VTATAV=diag(λ1,...,λn),其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn A T A A^{T}A ATA的特征值。
因为 A T A v i = λ i v i , A^{T}Av_i=\lambda_iv_i, ATAvi=λivi, v i T A T A v i = λ i v i T v i = λ i , v_i^{T}A^{T}Av_i=\lambda_iv_i^{T}v_i=\lambda_i, viTATAvi=λiviTvi=λi,所以 λ i = ( A v i ) T A v i ≥ 0 \lambda_i=(Av_i)^{T}Av_i\ge0 λi=(Avi)TAvi0则不妨设 λ 1 ≥ . . . ≥ λ n ≥ 0. \lambda_1\ge...\ge\lambda_n\ge0. λ1...λn0.

V = ( v 1 , . . . , v n ) , V=(v_1,...,v_n), V=(v1,...,vn) v i ( i = 1 , . . . , n ) v_i(i=1,...,n) vi(i=1,...,n) A T A A^{T}A ATA的属于 λ i \lambda_i λi的特征向量以及 R n R^{n} Rn的一组标准正交基,设 r = r a n k ( A ) r=rank(A) r=rank(A),有 ( A v i , A v j ) = v i T A T A v j = v i T λ j v j = { λ i ≠ 0 , if  i = j 0 , if  i ≠ j   ( i , j = 1 , . . . , r ) (Av_i,Av_j)=v_i^{T}A^{T}Av_j=v_i^{T}\lambda_jv_j=\begin{cases} \lambda_i\neq0, & \text{if $i=j$} \\ 0, & \text{if $i\neq j$ } \end{cases}(i,j=1,...,r) (Avi,Avj)=viTATAvj=viTλjvj={λi=0,0,if i=jif i=j (i,j=1,...,r)
其中, λ i = ∣ A v i ∣ , ( i = 1 , . . . , r ) \sqrt{\lambda_i}=|Av_i|,(i=1,...,r) λi =Avi,(i=1,...,r),且 A v 1 , . . . , A v r Av_1,...,Av_r Av1,...,Avr也为正交基,
u i = A v i ∣ A v i ∣ , i = 1 , . . . , r u_i=\frac{Av_i}{|Av_i|},i=1,...,r ui=AviAvi,i=1,...,r再将 u 1 , . . . , u r u_1,...,u_r u1,...,ur扩充成 R m R^{m} Rm的一组标准正交基 u 1 , . . . , u r , . . . , u m . u_1,...,u_r,...,u_m. u1,...,ur,...,um. U = ( u 1 , . . . , u m ) U=(u_1,...,u_m) U=(u1,...,um), 有 A V = A ( v 1 , . . . , v n ) = ( A v 1 , . . . , A v r , 0 , . . . , 0 ) = ( λ 1 u 1 , . . . , λ r u r , 0 , . . . , 0 ) = ( u 1 , . . . , u m ) d i a g ( λ 1 , . . . , λ r , 0 , . . . , 0 ) AV=A(v_1,...,v_n)=(Av_1,...,Av_r,0,...,0)=(\sqrt{\lambda_1}u_1,...,\sqrt{\lambda_r}u_r,0,...,0)\\=(u_1,...,u_m)diag(\sqrt{\lambda_1},...,\sqrt{\lambda_r},0,...,0) AV=A(v1,...,vn)=(Av1,...,Avr,0,...,0)=(λ1 u1,...,λr ur,0,...,0)=(u1,...,um)diag(λ1 ,...,λr ,0,...,0)所以 A = U Σ V T A=U\Sigma V^{T} A=UΣVT λ 1 ≥ . . . ≥ λ r . \sqrt{\lambda_1}\ge...\ge\sqrt{\lambda_r}. λ1 ...λr .

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值