在转录组 Bulk 测序数据分析中,差异基因的筛选与可视化是关键步骤,而火山图作为直观展示基因表达差异的工具,其美观度与信息传递效率直接影响分析结果的呈现质量。本文将分享 10 种基于 R 语言的火山图绘制方法,涵盖从数据准备到代码实战的完整流程,适用于不同场景下的差异基因可视化需求。
一、火山图的应用场景与价值
火山图通过横轴(log2 Fold Change)展示基因在两组样本中的表达差异倍数,纵轴(-log10 P-value)展示差异的统计学显著性,能快速区分显著上调、显著下调及无显著差异的基因。在期刊论文、项目汇报中,高质量的火山图不仅能清晰传递分析结果,更能提升内容的专业性与可读性。
二、数据准备:基因表达矩阵格式要求
绘制火山图的前提是正确的基因表达矩阵,需满足以下格式规范:
- 第一列:基因名称(如 GeneSymbol);
- 第二列及以后:各样本的基因表达值(FPKM、TPM 或 Counts 均可);
- 第一行:样本名称(需按分组顺序排列,如 Normal 组在前,Disease 组在后)。
示例数据格式如下(简化版):
| Gene | Normal1 | Normal2 | Disease1 | Disease2 |
|---|---|---|---|---|
| GeneA | 12.3 | 11.8 | 25.6 | 24.1 |
| GeneB | 8.7 | 9.2 | 3.1 | 2.8 |
三、核心代码框架与使用说明
3.1 数据读取与预处理
首先需读取基因表达矩阵,代码

最低0.47元/天 解锁文章
183

被折叠的 条评论
为什么被折叠?



