新的一年,从“火山图”启程,愿大家的科研之路如这绚丽的图景般红红火火!
在今天教学之前,先邀请大家一起来欣赏一些精美的NCS级别的可视化
数据分析的内核恒久不变,而可视化却是一片自由挥洒的画布。即使数据相同,巧妙的图表设计能让研究焕发新彩,宛如艺术品般引人注目,让人眼前一亮。多多欣赏好看的图片,就像在欣赏美景一样,让我们可以从独特的笔触学习研究者的思考与审美。
好了,闲话少说,让我们从火山图出发,探索那些独具匠心的差异基因可视化,感受科学与艺术的完美结合。
还是以之前差异基因分析的示例数据为例
火山图(Volcano Plot)
- 作用:展示差异表达基因的显著性和表达倍数变化(Fold Change)。
- 横轴 (X-axis):基因的Log2 Fold Change(表达倍数的对数值)。
- 纵轴 (Y-axis):基因表达显著性的-log10(P-value) 或 -log10(FDR)。
- 特点:
- 上调基因(通常标记为红色)。
- 下调基因(通常标记为蓝色)。
- 非显著基因(通常标记为灰色)。
R示例代码:
if (!requireNamespace('BiocManager', quietly = TRUE))
install.packages('BiocManager')
BiocManager::install('EnhancedVolcano')
library(EnhancedVolcano)
res <- read.csv("./APT_vs_AHa.csv", row.names = 1)
EnhancedVolcano(
res,
lab = rownames(res), # 使用数据框的行名作为标签
x = 'log2FoldChange', # x轴变量:log2倍数变化
y = 'pvalue', # y轴变量:p值
xlim = c(-4, 4), # x轴的范围
ylim = c(0,10), # y轴的范围
title = 'APT versus AHa', # 图表标题
FCcutoff = 1.5, # 倍数变化的截断阈值
pCutoff = 10e-2, # p值的截断阈值
#shape = 8 # 点的形状(此行被注释掉了)
legendLabels=c('Not sig.','Log (base 2) FC','p-value', 'p-value & Log (base 2) FC'), # 图例标签
legendPosition = 'right', # 图例位置
legendLabSize = 10, # 图例标签的字体大小
legendIconSize = 5.0, # 图例图标的大小
drawConnectors = TRUE, # 是否绘制连接线
widthConnectors = 0.75 # 连接线的宽度
#col = c("grey30", "forestgreen", "royalblue", "red2"), # 颜色设置
#colAlpha = 0.9, # 颜色透明度
#drawConnectors = TRUE, # 是否绘制连接线
#hline = c(10e-30), # 水平参考线位置
#widthConnectors = 0.5 # 连接线宽度
)
ggsave("Volcano.pdf",width = 10, height = 8, plot = p1)
结果解读
这张火山图展示了 APT 和 AHa 之间基因表达的差异。横轴表示 Log2 倍数变化(Log2 fold change),纵轴表示 -Log10 转换的 p 值。红色点代表显著上调或下调的基因(同时满足 p 值和倍数变化的阈值),蓝色点表示仅满足倍数变化的基因,绿色点表示仅满足 p 值的基因,灰色点则表示不显著的基因。图中标注的基因是变化最显著的基因。
后续精彩内容预告
在接下来的内容中,我们将深入探讨转录组差异基因分析可视化的更多细节,包括:
- 📊 更多的可视化图片的学习
- 🔍 富集分析与可视化
- 📚 系统项目学习等等
更多精彩内容,敬请关注公众号 N今天C了么,一起探索生信分析的奥秘!