16S 物种丰度热图学习

最新推荐文章于 2025-02-07 15:44:53 发布

原创最新推荐文章于 2025-02-07 15:44:53 发布 · 7.1k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#pheatmap #热图

微生物之16S 专栏收录该内容

16 篇文章

订阅专栏

### 1. 关于热图的用途(参考http://www.360doc.com/content/17/0729/17/45848444_675155815.shtml)

以RNA-seq为例，热图可以：

1）直观呈现多样本多个基因的全局表达量变化；

2）呈现多样本或多基因表达量的聚类关系。

第一个问题很容易理解，毕竟使用颜色（例如红绿的深浅）来展示多个样本多个基因的表达量高低，既直观又美观。

第二个问题，则需要考虑：你是否要做聚类，是对样本聚类还是对基因聚类。

热图软件都可以选择对绘图数值进行标准正态分布化（Z score）。也就是将一组值通过均一化，使其符合均值为0，方差为1的标准正态分布。

软件： ggplot2 pheatmap

## 2 otu输入文件的处理

文述：由QIIME+USearch生成的otu 表记录的是count 数，将文件作为heatmap 的输入文件时，需要做标准化的处理。

表的处理： colname : 样本名； rowname: 物种名，

标准化：

rrarefy（）

decostand(）

相对丰度：

prop.table（）

## 1 输入数据说明
head(data)
    sample1 sample2 sample3
sp1  相对丰度
sp2
sp3
sp4

（即计算sp1 在每一列的比例的百分比用函数prop.table(as.matrix（mytable）,2)）


## log均一化
dataLog=log2(data+1)
## pheatmap显示列的分组信息输入参数的设置
annotation_col = data.frame(group=group$group)
rownames(annotation_col) = colnames(dataLog)

## 绘图
pheatmap(dataLog, cluster_row = FALSE, annotation_col = annotation_col)