MDS多维缩放详解

最新推荐文章于 2024-07-05 22:58:15 发布

原创

最新推荐文章于 2024-07-05 22:58:15 发布 · 3.8k 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#MDS #机器学习

MDS（多维缩放）是一种经典的降维方法，旨在保持原始空间中样本之间的距离。通过特征值分解和选取最大的特征值，实现从高维到低维的转换。尽管MDS不能完全还原原始空间，但在数据降维和距离保持上有其价值。适用于某些流形空间的降维，但对于非欧几里得空间，如Swiss Roll，可能需要如Isomap等优化方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述
一开始先上两幅图是因为通过上图我们可以对降维有一个直观形象的了解。降维亦称“维数约简”，是经过某种数学变换将原始高维属性空间变为一个低维“子空间”。在这个子空间中样本密度大幅度提高，距离计算也变得更为容易。为什么能进行降维？因为在很多时候，人们观测或收集到的数据样本虽是高维的，但是与学习任务密切相关的也许仅是某个低维分布，即高维空间中的一个低维嵌入。上图给出了一个直观的例子，原是高维空间中的样本点，在这个低维嵌入子空间中更容易进行学习。

这篇我们讲的是MDS（Mutiple Dimensional Scaling）多维缩放这样一种经典的降维方法，该方法的核心便是要求原始空间中样本之间的距离在低维空间中得以保持。怎么理解这句话呢，举个简单的例子：就比如说我们要画一张地图，现实中的地球是三维立体的，那么计算现实中个位置间的距离需在三维坐标下进行，但是现在我们要画一张二维的平面地图，当然我们保持其二维坐标中各个位置间的距离要和在三维坐标系下的一致，这就是高维距离与低维距离的一致性。接下的公式推导会让我们对该方法的核心有更深刻的理解。

我们先假定一个样本数量为n，特征维数为m的样本空间 $\in R^{n \times m}$ ，这n个样本在原始空间中的距离矩阵为 $\in R^{n \times n}$ ，其中第i行j列的元素 $d i s t_{i j}$ 为样本xi到xj的距离。我们的目标是获得样本在d’维空间的表示 $\in R^{n \times d^{\prime}}$ ，d’ $≤\leq$ d，且任意两个样本在d’空间中的欧式距离等于原始空间中的距离。那么，我们设定等式:
$∥zi−zj∥=distij\left\|z_{i}-z_{j}\right\|=d i s t_{i j}$ 在此基础上求得降维后的样本空间Z。

现在我们已知的信息或者说是整个MDS算法的输入是原始的距离矩阵Dist，约束条件是 $∥zi−zj∥=distij\left\|z_{i}-z_{j}\right\|=d i s t_{i j}$ ，接下要做的就是如何通过已知输入和约束条件求得Z。
首先，我们计算一个降维后样本的内积矩阵B，令 $Z^{T} \in R^{n \times n}$ ，B中每个元素的值为： $b_{i j}=\sum_{k=1}^{d'} z_{i k} z_{j k}$ 接着我们计算一个降维后关于样本空间的距离矩阵D：
$\begin{aligned} d_{i j}^{2} &=\left(z_{i}-z_{j}\right)^{2} \\ &=\sum_{k=1}^{d'}\left(z_{i k}-z_{j k}\right)^{2} \\ &=\sum_{k=1}^{d'} z_{i k}^{2}+z_{j k}^{2}-2 z_{i k} z_{j k} \\ &=b_{i i}+b_{j j}-2 b_{i j} （１） \end{aligned}$ 而根据我们的约束条件，有 $d_{ij}^{2}=dist_{ij}^{2}　　　　（２）$