在转录组 Bulk 测序数据分析中,热图是展示基因表达模式、样本聚类关系的核心可视化工具。一张高质量的热图不仅能清晰呈现数据特征,更能提升研究成果的展示效果。本文基于 R 语言的pheatmap包,整理了六种适用于不同场景的热图绘制方法,涵盖基础聚类、分组对比、通路注释等需求,私信即可获取全部代码,方便科研人员快速实现数据可视化。
一、绘图前的数据准备
热图绘制的核心是基因表达矩阵,数据格式的规范性直接影响后续分析效果,需提前做好以下准备:
1.1 表达矩阵格式要求
表达矩阵需满足:
- 第一列为基因名(后续将作为行名);
- 从第二列开始为样本的基因表达值(FPKM、TPM 或 Counts 均可);
- 第一行为样本名称(作为列名)。
示例格式如下(简化版):
| GeneSymbol | Sample1 | Sample2 | ... | Sample60 |
|---|---|---|---|---|
| GeneA | 12.3 | 15.6 | ... | 8.9 |
| GeneB | 3.2 | 2.1 | ... | 5.7 |
1.2 数据读取与预处理
使用read.csv函数读取数据,注意保留基因名作为行名,避免样本名被自动修改:
# 读取表达矩阵(替换为实际文件路径)
data <- read.csv("gene_expression_matrix.csv", row.names = 1, check.names =

最低0.47元/天 解锁文章
1363

被折叠的 条评论
为什么被折叠?



