组学数据分析实操系列 |(四) 富集气泡图的绘制

前言:在上一篇中(点我查看详情),我们介绍了利用Metascape零代码实现富集分析,但是Metascape的富集分析结果是以柱状图的形式展示的。文章中更常使用的富集结果可视化方式是气泡图。气泡图可以通过气泡的坐标、形状、颜色、大小等来展示更加丰富的富集分析结果(如P值、数目、占比、类型等)。如果我们想把上述富集柱状图改为气泡图形式,或者在拿到富集分析结果表格后,经过调整阈值筛选进行重新绘图,该如何操作呢?

今天给大家介绍三款实现富集分析结果可视化的绘图工具:微生信ImageGPSangerBox网站。这些工具提供了丰富的可视化选项,据以优化(富集) 分结果的展现形式,方便读者更好地理解和解释数据。

方式一:

微生信绘制气泡图

01数据获取

以Metascape富集分析结果为例,如下图所示:在Metascape网站完成富集分析后,点击Analysis Report Page,跳转至结果页面,找到Pathwayand Process Enrichment Analysis复制以下表格,粘贴至Excel表格。

图片

02登录微生信网站

在浏览器中输入微生信网址(http://www.bioinformatics.com.cn),在网页右上角注册后登录。

03单击左列的GO,Pathway图,选择多类型气泡图

图片

04数据格式转化及可视化

上一步点击后的页面分为两个部分,左边用于粘贴数据和调整参数,右边是对数据输入格式的说明。其中调整参数的部分大家可以参考下方的示例图。

图片

而粘贴数据之前需要先点击页面右侧“输入:示例数据”,查看数据格式的标准示例,然后根据示例将第一步得到的数据进行调整,一般需要调整以下内容(原始条目——调整后的条目):Category  ClassDescription → Description% → GeneratioCount → CountLog10(P) → 通过公式power(10, Log10(P))进行转化得到pvalue

图片

完成输入数据、调整参数后,点击提交。等待几秒后,右侧便会出现结果气泡图,在下载处点击所需的文件格式就可以啦。

图片

05其他形式的富集结果图

除了上述“多类型气泡图”的形式外,该网站工具还提供了其它的富集分析结果可视化方式,下图展示的是其中两种形式。其操作方法类似,大家可以根据需求和喜好进行选择。

图片

方式二:

SangerBox

访问SangerBox网站(http://sangerbox.com/home.html),注册后登录。

01

图片

开始绘制气泡图

02

首先点击生信工具盒——工具列表——定制化气泡图绘制工具,进入绘制气泡图页面。

接下来在表格区域输入数据,注意这个数据的信息排布与前一个工具有所不同,第一列YData输入富集途径(Description),第二列输入GeneRatio,第三列点大小输入Count,第四列点颜色输入P,第五列点类型输入Class

最后根据实际需求调整绘图参数,如点的大小点的颜色点的形状背景风格。点击立即提交,开始绘制气泡图。

图片

导出气泡图

03

于页面下方导出图片处导出气泡图,在导出之前,可在设置长宽处调整图片的长度和宽度,在自定义渐变处调整颜色。

图片

方式三:

ImageGP

01

登录ImageGP网站

网站地址:http://www.ehbio.com/ImageGP/index.php/Home/Index/Scatterplot.html

02

开始绘制气泡图

点击GO Enrichmentplot,进入以下页面,页面上方显示数据格式Datamatrix,并提示如何选择必要参数。

图片

操作步骤:

  • 粘贴数据至下方白色框中

  • Essential parameters(必选)区域选择相应的参数变量

  • Layout(选填)区域可以改变图注的位置

  • Modify plot titles(选填)区域可以输入X、Y轴名称

  • Picture attributes(选填)改变图片大小

  • 右下角点击Plot进行绘图

  • Plot area可预览及下载富集气泡

图片

以上就是实现富集分析结果可视化的工具介绍啦,操作都很简单,小伙伴可以自己试一试,如果有问题的话可以联系我们哦!

参考文献

1.Tang D, Chen M, Huang X, Zhang G, Zeng L, Zhang G, Wu S, Wang Y. SRplot: A free online platform for data visualization and graphing. PLoS One. 2023 Nov 9;18(11):e0294236.

2.Chen T. et al. 2022. ImageGP: An easy-to-use data visualization web server for scientific researchers. iMeta 1: e5.

3.Shen, et al. 2022. Sangerbox: A comprehensive, interaction-friendly clinical bioinformatics analysis platform. iMeta 1(3): e36.

数据关联分析是当前生物医研究中的一个关键领域,它允许研究者从多个生物层面(如基因、转录、蛋白质、代谢等)对生物系统进行综合理解。这种分析方法在疾病机制探索、生物标志物发现、药物靶点识别以及精准医疗等方面具有广泛应用。 ### 数据准备与预处理 在进行多数据关联分析之前,数据的准备和预处理是至关重要的一步。由于不同数据的生成技术(如高通量测序、质谱等)和数据特征(如离散型、连续型、高维稀疏性等)存在显著差异,因此需要针对每种类型的数据进行标准化、归一化和质量控制[^1]。 例如,对于基因数据,通常需要进行SNP calling、变异注释等步骤;对于转录数据,则需要进行表达量计算、差异表达分析等;而对于代谢数据,可能需要进行峰识别、定量和代谢物注释等作。 ### 数据整合策略 在数据整合阶段,常见的策略包括基于统计的方法、基于网络的方法和基于机器习的方法。 - **统计方法**:如主成分分析(PCA)、偏最小二乘回归(PLS)、典型相关分析(CCA)等,可以用于识别不同数据之间的潜在结构和相关性。 - **网络方法**:构建多层生物网络,如基因-蛋白-代谢物相互作用网络,可以帮助识别跨的功能模块和关键节点。 - **机器习方法**:使用集成习、深度习等技术,可以捕捉非线性关系并进行预测建模,例如使用多模态深度习模型来整合不同类型的数据以预测疾病表型。 ### 工具与平台 在作中,有许多工具和平台可用于多数据的整合与分析: - **R/Bioconductor**:提供了多个用于多数据分析的包,如`mixOmics`、`blockForest`、`MOFA2`等。 - **Python**:有`scikit-learn`、`pandas`、`numpy`等库支持数据处理与机器习分析,也有专门针对多数据的库如`multiomics`。 - **专用软件**:如`Cytoscape`用于构建和分析生物网络,`Pathway Studio`用于通路级分析,`IPA`(Ingenuity Pathway Analysis)用于功能富集和调控网络分析。 以下是一个使用`mixOmics`包进行多数据整合的简单R代码示例: ```r library(mixOmics) # 假设我们有两个数据集X和Y # X: 第一数据(例如基因表达) # Y: 第二数据(例如代谢物浓度) # 使用PLS方法进行整合分析 pls.model <- pls(X, Y, ncomp = 2) # 可视化结果 plotVar(pls.model, var.names = TRUE, pch = 16, cex = 0.8, col = c("blue", "red")) ``` ### 分析与解释 分析完成后,需要对结果进行深入解释。这包括识别关键变量、构建调控网络、进行功能富集分析等。例如,在PLS分析中,可以通过变量重要性投影(VIP)评分来识别对模型贡献较大的变量;在网络分析中,可以使用中心性指标来识别网络中的关键节点。 此外,整合分析的结果应与生物知识相结合,通过文献检索、数据库查询(如KEGG、Reactome、STRING等)来验证发现的关联是否具有生物意义。 ### 挑战与展望 尽管多数据整合分析具有巨大潜力,但也面临诸多挑战,包括数据异质性、样本量不足、计算复杂度高、结果解释困难等。未来的发展方向可能包括更高效的算法开发、更好的可视化工具、更完善的生物注释系统以及跨科合作的加强。 通过上述步骤和技术,可以系统地进行多数据的关联分析,从而揭示复杂的生物过程和机制。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值