PCA与SVD_pca和svd-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_37395293/article/details/124479374

本文探讨了维度灾难问题以及为解决此问题提出的两种主要方法：监督降维的LDA和无监督降维的PCA。PCA通过坐标变换和最小化重构误差来寻找数据的主要成分，而SVD等价于PCA，两者都涉及求解矩阵的特征值。在PCA中，低维表示最大化方差，使得数据在各个维度上分散且不相关。LDA则侧重于最大化类别间的方差。博客还介绍了PCA和SVD的算法流程及性质。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

PCA与SVD

本文属于查缺补漏，赶紧来复习一下
先贴上本文参考链接
后面公式涉及到大量矩阵打起来实在不方便，就贴图了

一、起因

其起因在于我们常说的维度灾难，许多学习的方法都会涉及到距离计算，而高维空间会给距离计算带来很多麻烦。

数据样本稀疏、距离计算困难等问题是所有机器学习方法共同面临的严重障碍，即我们常说的维度灾难

为解决该问题，主要提出了两种解决方法

监督降维方法：线性判别分析 LDA
无监督降维方法： PCA

对应的评估方法：比较前后学习器性能

注意事项：常见的这些降维算法，主要还是基于距离来计算重构误差，需要对特征进行标准化来避免量纲对距离计算产生的影响

二、主成分分析 PCA

用起来很快乐，面试被问到立马痛苦了起来

一、坐标变换

我们期望能够将 $N$ 维的特征降维到 $D$ ，这里我们用 $X$ 表示 $N$ 维的特征矩阵， $Z$ 为降维后的特征矩阵， $W$ 为坐标变换矩阵

则有
在这里插入图片描述
其中 $Z = W^{T} X$ 对于 $z_{i,j} = \sum{w_i*x_j}$ 即w的对应行乘以x的对应列再求和。
本质上就是通过线性组合原始特征，保留重要的信息，降低特征维度

二、重构误差

考虑对 $z$ 进行重构，重构后的样本为 $\hat{x} = W z$
在这里插入图片描述
而我们PCA降维要求重构误差最小，因此可以变成求解如下的优化问题：

经过一系列简化（推到见参考链接）可以得到如下问题

同时满足约束 $W^TW = I_{d*d}$
可以看到，我们要求解 $W$ 的本质就是求解 $X^TX$ 的特征值