通俗易懂的主成分分析法（PCA）详解

最新推荐文章于 2025-11-18 09:22:20 发布

转载最新推荐文章于 2025-11-18 09:22:20 发布 · 10w+ 阅读

279

1.1k

文章标签：

#机器学习主成分分析法 PCA

机器学习专栏收录该内容

11 篇文章

订阅专栏

本文深入浅出地介绍了PCA(主成分分析)的基本数学原理及其在数据降维中的应用。PCA通过线性变换将原始数据转换为一组各维度线性无关的表示，可用于提取数据的主要特征分量，特别适用于高维数据的降维。

转载自：http://blog.codinglabs.org/articles/pca-tutorial.html

文章分析脉络梳理：

1.向量A和B的内积表示的是向量A在B上的投影长度。那么将一个向量与新的基做内积，结果则表示该向量在新的基下的坐标。

2.将新选定的基表示成矩阵形式，与原向量相乘，就得到了原向量在新选定的基所表示的空间（或坐标系）中的坐标表示了。

3.怎样选定这组基用于数据降维？（目标）

（1）首先将数据变换到选定基上后，数据的方差要大，尽量分散。

（2）各个基要正交（表示的信息要不相关，若单纯按方差选定基，则选定的基存在很大的相关性）

4.怎么做?怎么找这组正交基？（做法）

（1）协方差矩阵可以很好地表示各个特征的方差和不同特征之间的协方差

（2）按目标要求需要将协方差矩阵除去对角线元素化为0，对角线元素按从大到小排列。协方差矩阵对角化。

（3）对角化后按特征值大小排列，选定前k个最大的特征值对应的特征向量作为降维后的新基。

PCA（Principal Component Analysis）是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示，可用于提取数据的主要特征分量，常用于高维数据的降维。网上关于PCA的文章有很多，但是大多数只描述了PCA的分析过程，而没有讲述其中的原理。这篇文章的目的是介绍PCA的基本数学原理，帮助读者了解PCA的工作机制是什么。

当然我并不打算把文章写成纯数学文章，而是希望用直观和易懂的方式叙述PCA的数学原理，所以整个文章不会引入严格的数学推导。希望读者在看完这篇文章后能更好的明白PCA的工作原理。

进一步讨论

根据上面对PCA的数学原理的解释，我们可以了解到一些PCA的能力和限制。PCA本质上是将方差最大的方向作为主要特征，并且在各个正交方向上将数据“离相关”，也就是让它们在不同正交方向上没有相关性。

因此，PCA也存在一些限制，例如它可以很好的解除线性相关，但是对于高阶相关性就没有办法了，对于存在高阶相关性的数据，可以考虑Kernel PCA，通过Kernel函数将非线性相关转为线性相关，关于这点就不展开讨论了。另外，PCA假设数据各主特征是分布在正交方向上，如果在非正交方向上存在几个方差较大的方向，PCA的效果就大打折扣了。

最后需要说明的是，PCA是一种无参数技术，也就是说面对同样的数据，如果不考虑清洗，谁来做结果都一样，没有主观参数的介入，所以PCA便于通用实现，但是本身无法个性化的优化。

希望这篇文章能帮助朋友们了解PCA的数学理论基础和实现原理，借此了解PCA的适用场景和限制，从而更好的使用这个算法。

58 条评论

汽院本硕博连读十年 2022.07.20
讲得实在是太好了，刚学完线代的来看这个会觉得非常好理解

ASHIDONG158 2022.05.28
博主对线性代数的解释真是神

柔笔写风云 2022.04.06
博主对基和坐标的描述给我一种醍醐灌顶的感觉，感谢

base23 2021.03.02
博主真的写得很详细易懂，真的棒！

xkqjs1988 2020.12.25
我看到这个地方，感觉字母应该写错了。原句：一般的，如果我们有M个N维向量，想将其变换为由R个N维向量表示的新空间中......，此处应该是M个R维向量表示的新空间中。

janefavor 2020.11.11
写的太好了，通俗易懂，深入浅出

璐璐他哥 2020.11.06
这篇写的真的挺好我这个高数渣渣竟然看懂了

甜甜昭昭 2020.10.31
感谢博主，写的真好。请问博主，这是参考的一本书吗？能告诉我您参考的哪本书吗？除了PCA我想看看有没有其他可参考的材料。感谢！

·Tu me manques 2020.07.23
文章末尾，降维后的表示Y的最后一个数应该是写错了吧，应该没有符号吧！
- ·Tu me manques回复Remi蓝海 2020.07.29
  [reply]m0_48945640[/reply]对，
- Remi蓝海回复·Tu me manques 2020.07.27
  [reply]qq_43752906[/reply]我也觉得最后一个数写错了，应该是1/√2，这样Y的均值才为零。