聚类分析:从基因到数学测试的应用
1. 引言
聚类分析是一种强大的数据挖掘技术,可将相似的数据点归为一类,在基因研究和教育测试等领域有着广泛应用。本文将详细介绍如何使用R语言进行层次聚类和二元聚类分析,包括基因聚类和数学测试数据的聚类。
2. 层次聚类 - 基因聚类
2.1 准备工作
为了进行层次聚类,我们将使用小鼠的数据集,包括 GSE4051_data 和 GSE4051_design ,它们分别以 GSE4051_data.csv 和 GSE4051_design.csv 的CSV格式提供。
-
GSE4051_data数据集有29,949行和39个变量,部分数值变量如下: -
Sample_21 -
Sample_22 -
Sample_23 - …
-
GSE4051_design数据集有39行和4个变量,其中数值变量为sidNum,非数值变量为sidChar、devStage和gType。
2.2 数据探索
首先,我们需要加载一些必要的R包:
R语言实现聚类分析及应用探讨
超级会员免费看
订阅专栏 解锁全文
2678

被折叠的 条评论
为什么被折叠?



