降维之流形学习降维法

最新推荐文章于 2025-04-28 22:02:38 发布

原创最新推荐文章于 2025-04-28 22:02:38 发布 · 1.6k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

机器学习算法的直觉专栏收录该内容

13 篇文章

订阅专栏

本文探讨流形学习的概念，解释其如何在局部保持欧氏空间特性，从而实现从高维空间到低维流形的降维。介绍了等度量嵌入(Isomap)和局部线性嵌入(LLE)两种降维方法，详细阐述了它们的算法步骤及原理。

之前总觉得流形是一个很奇特的东西。想不明白是啥，没有具体的概念，到现在才稍微有一些明白。

这里分享一些自己的见解。

概念上，流形是在局部上与欧氏空间同胚的空间。

这句话我的理解是，在局部里，计算两样本之间的距离，高维和低维是一样能用欧式距离来计算的。

这就给降维带来了启发：当低维流形嵌入到高维空间时，虽然高维空间异常复杂，但是在局部还是有欧氏空间的性质，因此，可以在局部建立起高维空间和低维空间之间的映射，然后推广到全局。这就完成了降维操作。

这次介绍两种利用刚才描述的性质进行降维的方法：
1.等度量嵌入（Isomap）
2.局部线性嵌入（LLE）

由于高维空间中的直线距离在低维流形嵌入中是不可达的，（在高维空间直接计算直线距离是有问题的）

这里我们把流形映射到三维空间的某S形曲面上，

黑色的直线就是我们在此空间中的企图：直接计算直线距离，这是不对的。

正确的距离计算应是是遵循着红线（称测底线）。

因此，我们用近邻距离来近似：

这是在二维中的表现，额，先不在意这个，我们来看看我们应该关注的东西：什么是近邻距离？

（上图中的红线是我们在S曲面中到达另一样本的测底线距离，）

而近邻距离就是我们找到我们的近邻，然后由近邻找近邻的近邻，这样一步步下去，最终到达目的地。

当然了，为了路径最短，我们还要想法子。（图算法-最短路径）

等度量嵌入的直观：

距离近似的方式：高维时两样本之间的距离在降维之后不变。

Isomap算法：

1.遍历每一个样本，找出每一个样本的近邻（类似于K近邻法来找，或者限定某个距离范围内的样本都是其近邻也许）

然后把该样本的近邻样本连接前来/

2.用图算法，计算出所有样本间的距离，形成距离矩阵M，然后利用降维前后样本间距离不变这样思想的 MDS 算法，得到降维的结果。

局部线性嵌入的直观：

距离近似的核心思想：降维前后，空间中两样本之间的线性关系是不变的，即，线性关系中样本间的Wi是固定的。

LLE 算法：

1.遍历所有的样本，确定他们各自的近邻，并在原本的高维空间中，计算得到所有样本与它们近邻样本之间线性关系的Wi，

2. 利用降维后样本间的线性关系是不变的，在低维中空间中列出某个求Z（降维后的向量）的式子，

对该式子推演后会得到一个矩阵M，把M进行特征值分解得到的最小的d个特征值对应的特征向量就是我们求得的解了。

ok，

88

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。