人工智能教程：PCA降维维度样本数 feature数

最新推荐文章于 2025-03-06 08:30:00 发布

原创最新推荐文章于 2025-03-06 08:30:00 发布 · 4k 阅读

CC 4.0 BY-SA版权

本文深入解析PCA降维技术，阐述为何降维后的特征数不能超过样本数，以及这一限制背后的数学原理。通过直观的例子，如将数据点投影到直线上，帮助读者理解PCA的运行机制。

这期给大家讲人工智能，上次有伙伴要教程，这两天给大家总结好了视频教程！

问题：PCA降维后的feature数如果少于样本数，为什么会报错把n_components一旦改为超过230后，会有截图中的错误，即：

ValueError: n_components=250 must be between 0 and min(n_samples, n_features)=230 with svd_solver='full'

Answer:

PCA降维实现的依旧是对features的减少，而不是样本数，这个你要记住。因此降维之后的样本数量是不变的，feature数量会变少。

为什么pca降维后feature数量多余样本数量会报错？这是算法本身决定的，要求降维后的feature数量少于样本数：

思考pca降维的原理，如果要降到n维，那就需要构建一个n维德投影空间，而这个投影空间是要通过n+1个样本数量决定的，如果样本数量太少，那就无法得到一个有效的投影空间。举个最简单的例子：

把数据点投影到一条直线上，理解为投影到一维空间，那就需要有两个或两个以上的点，这样才能确定一条直线，使样本到直线德距离之和最小，如果只有一个点，那是有无数条直线的。因此需要样本数量大于一。

人工智能教程：PCA降维维度样本数 feature数

不清楚的地方，伙伴们可以留言，想学习人工智能，可以关注一下更新，更多的教程也会继续更新，伙伴们也可以跟着全套视频教程学，要视频教程的，可以评论回复：人工智能！

人工智能教程：PCA降维 维度 样本数 feature数