代谢组学结果在线分析:不同组差异代谢物高级韦恩图Venn的绘制——UpSet图

文章介绍了UpSet图作为Venn图的变体,用于集合数据的可视化,特别是转录组和代谢组分析。作者分享了如何在联川生物云平台上准备数据,利用Excel公式标记样本组别的代谢物存在情况,并生成UpSet图。网站提供了参数调整和多种格式的图像导出功能。

什么是UpSet图?

可以说是Venn图的变体,对于集合数据的可视化,适用于少量组别的数据集,一般用于转录组数据基因交集分析,而我最近在分析不同组别的代谢组数据的时候发现同理,下面以我自己数据为例,效果图如下:

image-20230326154614752

UpSet图在线分析网站

  • 我这里直接用的是联川生物云平台,云工具-搜索-UpSet图
    image-20230326154921286

  • 下载官方示例文件准备数据
    image-20230326155102434

  • 列名是基因名称(那我的示例中就是代谢物名称),行名是样品分组名称,该样品检测到了列名,对应位置就标记为“1”,否则为“0”,具体整理见下方数据准备

image-20230326161820609

数据准备

  • 网站有具体的视频教程,但简而言之就是所有组别鉴定到的物质名称并集作为一列,各组别包含这个物质就记为1,没有就记为0,下面进行示例:我要制作Rumen、Serum和Milk当中鉴定到的差异代谢物的Upset图
  • A列是Rumen、Serum和Milk当中鉴定到的差异代谢物的并集,F/G/H是Rumen、Serum和Milk分别鉴定到的差异代谢物,现在目标是若F列和An列有重合的数据,在Bn列就标记“1”,比如查找A2的(+/-)12(13)-DiHOME这个,物质是否在Rumen中存在,使用公式=IF(COUNTIF(F:F,A2)=0,"1","0"),同列下拉即可(更多求两列之间重复数据的公式可以参考 Excel表格中两列数据对比,找出异同的数据

image-20230326160227179

  • 都查找得到数据后,复制B/C/D后重新粘贴,选择仅粘贴数值,删除F/G/H列,即可保存上传网站进行分析

生成结果图与调整

不过多赘述,左侧参数调整区域可以设置字号、图形大小、坐标轴等,右侧支持导出PNG/PDF/SVG/TIFF等多种格式,可调整图片大小,并可以下载交集数据,效果在题头已经给出,更多可以自行摸索

### UPSET简介 UPSET是一种用于展示多个集合之间交集、并集及其相互关系的可视化方法[^1]。相比传统的VennUPSET更适合处理涉及较多集合的情况,因为它能够清晰地表示集合之间的各种复杂交互关系,并提供更加灵活和可扩展的布局方式。 --- ### R语言中绘制UPSET的方法 在R语言中,可以通过`UpSetR`包实现UPSET绘制。以下是具体的操作流程: #### 安装与加载所需库 如果尚未安装`UpSetR`包,则需要先完成安装: ```r install.packages("UpSetR") ``` 随后加载该包以便后续操作: ```r library(UpSetR) ``` #### 准备数据 假设我们有如下几个集合A, B, C, D,它们分别代表不同的类别或分: ```r data <- data.frame( A = sample(c(TRUE, FALSE), 100, replace = TRUE), B = sample(c(TRUE, FALSE), 100, replace = TRUE), C = sample(c(TRUE, FALSE), 100, replace = TRUE), D = sample(c(TRUE, FALSE), 100, replace = TRUE) ) ``` 上述代码创建了一个随机布尔矩阵作为输入数据源。 #### 使用`upset()`函数绘制表 调用`upset()`函数即可生成UPSET: ```r upset(data, nsets = 4, nintersects = 40, order.by = "freq", decreasing = TRUE) ``` - 参数说明: - `nsets`: 显示的最大集合数量。 - `nintersects`: 控制显示的交集数上限。 - `order.by`: 排序依据(频率或其他指标)。 - `decreasing`: 是否按降序排列。 此命令会生成一张包含四个集合间所有可能交集的UPSET。 --- ### 数据可视化的意义 数据可视化是现代科研究和技术开发领域的重要成部分[^2]。通过有效的形化表达手段,可以帮助人们迅速抓住海量数据背后隐藏的关键模式与趋势。特别是在生物医等领域,利用诸如UPSET这样的高级工具,可以显著提升对多维数据的理解程度,进而辅助做出更为精准合理的判断[^3]。 --- ### 高级应用场景 对于希望进一步优化科研绘效果的研究者来说,除了掌握基础作技巧外,还需要关注以下几个方面: - **AI驱动的设计原则**: 结合人工智能技术自动生成最佳配色方案及版面安排建议。 - **跨平台兼容性测试**: 确保最终产出物能够在不同设备上保持一致观感体验。 - **遵循国际标准指南**: 如IEEE VIS Conference推荐的最佳实践等文件所规定的要求。 这些措施共同构成了高质量表制作的核心要素之一。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值