PCA与SVD的联系与区别是什么?

PCA与SVD的联系与区别

原理分析

PCA(主成分分析)和SVD(奇异值分解)是数据降维和特征提取的核心工具
假设数据矩阵 XXX(已中心化):

  • PCA步骤:先计算协方差矩阵 C=1n−1XTXC=\frac{1}{n-1}X^TXC=n11XTX,其次计算CCC的特征向量: CCC是一个对称矩阵可以被对角化,即C=VLVTC=VLV^TC=VLVT,其中VVV是特征向量,LLL是对角矩阵,其对角中间数值为 λ1,λ2,λ3,… ,则XVXVXV就是降维后的向量,降维的程度取前多少个特征向量。
  • SVD步骤:直接分解 X=UΣVTX=UΣV^TX=UΣVT,其中UUU为左奇异向量(正交), SSS为对角矩阵中间数值为s1,s2,s3,...s_1,s_2,s_3,...s1,s2,s3,...VVV为右奇异向量(正交)。
    结合SVD与PCA的步骤,有:
    C=VSUTUSVT/(n−1)=VS2n−1VTC=VS{U^T}US{V^T}/(n - 1)=V\frac{{{S^2}}}{{n-1}}{V^T}C=VSUTUSVT/(n1)=Vn1S2VT
    对比PCA的对角化的结果:有λi=s2i/(n−1){\lambda _i} = {s^2}_i/(n - 1)λi=s2i/(n1),且有XV=USVTV=USXV = US{V^T}V = USXV=USVTV=US

区别对比

在这里插入图片描述

总结

  1. PCA的核心数学实现可视为SVD的协方差场景特例,即当对中心化数据矩阵进行奇异值分解时,其左奇异向量直接对应主成分方向(特征空间基轴),而奇异值的平方恰为协方差矩阵的特征值(表征各维度方差能量)。这种等价性使SVD成为求解PCA的数值稳定捷径,无需显式计算协方差矩阵(避免病态条件问题),直接通过数据矩阵分解一步获得主成分与能量分布。【SVD直接分解,PCA对协方差矩阵操作后分解】
  2. 奇异值和特征向量存在关系,有λi=s2i/(n−1){\lambda _i} = {s^2}_i/(n - 1)λi=s2i/(n1)
  3. SVD可以获取另一个方向上的主成分,而PCA只能获得单个方向上的主成分,PCA只与SVD的右奇异向量的压缩效果相同【SVD更加通用】
  4. 通过SVD可以得到PCA相同的结果,但是SVD通常比直接使用PCA更稳定。因为在PCA求协方差时很可能会丢失一些精度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

JackHCC

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值