20、降维算法全面解析：从基础概念到实战应用

gin88

于 2025-09-23 11:46:24 发布

阅读量6

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习实战精要文章标签：降维算法 PCA 核PCA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/gin88/article/details/154941596

机器学习实战精要专栏收录该内容

75 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

降维算法全面解析：从基础概念到实战应用

1. 降维的主要方法

在深入探讨具体的降维算法之前，我们先来了解两种主要的降维方法：投影（Projection）和流形学习（Manifold Learning）。

1.1 投影

在大多数实际问题中，训练实例并非均匀分布在所有维度上。许多特征几乎是恒定的，而其他特征则高度相关。这导致所有训练实例都位于（或接近）高维空间中的一个低维子空间。

例如，有一个 3D 数据集，所有训练实例都靠近一个平面，这个平面就是高维（3D）空间中的一个低维（2D）子空间。我们将每个训练实例垂直投影到这个子空间上，就得到了一个新的 2D 数据集，这样就将数据集的维度从 3D 降低到了 2D。

不过，投影并不总是降维的最佳方法。在很多情况下，子空间可能会扭曲和转弯，就像著名的瑞士卷玩具数据集。如果简单地将其投影到一个平面上，会把瑞士卷的不同层挤压在一起，而我们真正想要的是将瑞士卷展开以获得一个 2D 数据集。

1.2 流形学习

瑞士卷是一个 2D 流形的例子。简单来说，2D 流形是一种可以在高维空间中弯曲和扭曲的 2D 形状。更一般地，d 维流形是 n 维空间（其中 d < n）的一部分，它在局部上类似于 d 维超平面。

许多降维算法通过对训练实例所在的流形进行建模来工作，这就是流形学习。它依赖于流形假设，即大多数现实世界的高维数据集都靠近一个低得多的维流形。这个假设在很多情况下都能通过实验观察到。

以 MNIST 数据集为例，所有手写数字图像都有一些相似之处，如由相连的线条组成、边界是白色的，并且大致居中。如果随机生成图像，只有极小一

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。