热图与树状图的绘制与应用
1. 聚类与可视化简介
聚类技术主要分为 K 均值聚类和层次聚类。树状图是层次聚类的一部分,它是一种类似树的结构,在我们事先不知道聚类数量时,可用于数据的可视化。聚类在生物学(研究基因组数据)、金融(研究外汇市场、股票、指数中的不同行业等的聚类情况)和经济学(研究不同城市的犯罪情况和国际贸易)等领域都有广泛应用。
2. 构建简单树状图
- 原理 :聚类的核心思想是检测具有相似性的数据组,将数据划分为具有共同特征的不同组。树状图能帮助我们更准确地研究各种聚类的形成,通过在不同高度切割树结构,可以区分具有不同特征的聚类。
- 操作步骤 :
- 准备数据 :
set.seed(5)
x = rnorm(10)
y = rnorm(10)
z = seq(1,10, by = 1)
2. **数据处理**:
mtx = data.frame(cbind(x,y,z))
d = dist(mtx, method = "euclidean")
clust = hclust(d, "ave")
3. **绘制图形**:
超级会员免费看
订阅专栏 解锁全文
277

被折叠的 条评论
为什么被折叠?



