写在前面
帮忙处理数据时,拿到数据第一件事就是看下所谓之前的分组是不是合理的有效,如果不合理有效又应该如何呢?这是一个非常重要的问题。
聚类图
d <- dist(t(logCPM), method = "euclidean")
# 聚类,类之间还是没有分开,这个说明了什么问题,这个说明的是个体的差异比加药后的差异大
# for 循环批量计算聚类并绘图
for (i in c("complete","average","ward.D")) {
hc1 <- hclust(d, method = i)
plot(hc1, cex = 0.6, hang = -1,main = i)
}
PCA图
dat=as.data.frame(t(logCPM)) # 画PCA图时要求是行名时样本名,列名时探针名,因此此时需要转换。格式要求data.frame
library("FactoMineR")# 计算PCA
library("factoextra")# 画图展示
dat.pca <- PCA(dat, graph = F)
# fviz_pca_ind按样本 fviz_pca_var按基因
fviz_pca_ind(dat.pca,
geom.ind = "text", # c("point", "text)2选1
col.ind = group_list, # color by groups
# palette = c("#00AFBB", "#E7B800"),# 自定义颜色
addEllipses = T, # 加圆圈
legend.title = "Groups"# 图例名称
)