数据降维与可视化方法解析
1. 多维尺度分析(MDS)
1.1 MDS 原理
MDS 通过对一组对象之间的相似性进行可视化展示,揭示数据的结构。它将对象放置在 n 维空间中,点对之间的距离对应对象对之间的相似性。通常,维度空间是二维欧几里得空间,但也可以是非欧几里得空间且维度大于二维。根据输入矩阵的性质,MDS 主要分为两类:
- 度量 MDS(Metric MDS) :输入矩阵基于度量。它也被称为主坐标分析,先将距离转换为相似性。最简单的形式是通过对相似性进行主成分分析,将原始数据点线性投影到子空间;也可以通过最小化应力值进行非线性投影。
- 非度量 MDS(Nonmetric MDS) :输入矩阵基于非度量。当数据在顺序水平上测量时使用,仅距离的排名顺序有意义,它应用单调递增函数将原始距离投影到保留排名顺序的新值。
1.2 在 swiss 数据集上执行 MDS
1.2.1 度量 MDS
# 假设已经加载了 swiss 数据集
# 计算距离矩阵
swiss.dist = dist(swiss)
# 执行度量多维尺度分析
swiss.mds = cmdscale(swiss.dist, k=2)
# 绘制二维散点图
plot(swiss.mds[,1], swiss.mds[,2], type="n")
text(swiss.mds[,1], swiss.mds[,2], rownames(swiss), cex = 0.9, xpd = TRUE)
<
超级会员免费看
订阅专栏 解锁全文
2083

被折叠的 条评论
为什么被折叠?



