生信常用分析图形绘制04 -- 桑基图

本文介绍了如何利用R语言和ggplot2库绘制生物信息学常用的图形,如热图、火山图、桑基图等,并提供了实例数据和代码,适合初学者和进阶者学习生物信息分析可视化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

封面

有了R语言的基础,以及ggplot2绘图基础,我们的生信常用分析图形的绘制就可以提上日程了!本系列,师兄就开始带着大家一起学习如何用R语言绘制我们自己的各种分析图吧!

由于本系列的所有分析代码均为师兄细心整理和详细注释而成的!欢迎点赞、收藏、转发!

您的支持是我持续更新的最大动力!

示例数据和代码获取

系列内容包括:

  • 各种类型的热图你学会了吗?
    • 普通热图
    • 环形热图
  • 解锁火山图真谛!
    • plot函数就能画火山图?
    • 高级函数绘制火山图–ggplot2、ggpurb
  • 经典富集分析及气泡图、柱状图绘制
    • 气泡图绘制
    • 柱状图绘制
  • 富集分析圈图
  • 富集分析弦图
  • 绘制一张可以打动审稿人的桑基图
  • 生存分析 – KM曲线图
  • 基础PCA图
  • 云雨图
  • 韦恩图
  • 环形互作网络图
  • 相互作用网络图
  • 聚类树美化
  • 富集分析气泡图进阶版
  • mantel test相关性图
  • 词云图
  • 瀑布图
  • 森林图
  • 曼哈顿图
  • 哑铃图
  • 三线表
  • 嵌套圈图
  • 列线图
  • 蜂群图
  • 箱线图+贝塞尔曲线
  • 矩阵散点图
  • 等等,想到再继续补充!!!

本期富集分析圈图效果展示

效果预览

数据构建

############## 绘制桑基图 ######################
# 搞清楚需要的数据结构:
nodes = data.frame("name" = 
                     c("Node A", # Node 0
                       "Node B", # Node 1
                       "Node C", # Node 2
                       "Node D"))# Node 3

links = as.data.frame(matrix(c(
  0, 1, 10, # Each row represents a link. The first number
  0, 2, 20, # represents the node being conntected from. 
  1, 3, 30, # the second number represents the node connected to.
  2, 3, 40),# The third number is the value of the node
  byrow = TRUE, ncol = 3))

names(links) = c("source", "target", "value")

# 查看构建的数据:
> head(nodes)
    name
1 Node A
2 Node B
3 Node C
4 Node D
> head(links)
  source target value
1      0      1    10
2      0      2    20
3      1      3    30
4      2      3    40

可以看到绘制桑基图,主要用到两个数据,一个是节点的名称信息 – nodes;另一个是节点之间的链接信息 – links;

第一个不用多说。第二个稍微解释一下,links数据框中应该包含三列:

  • 其中第一列为source,即连接线的起始端;
  • 第二列为target,表示连接线的末端,这里的0,1,2,3分别代表nodes信息中的1-4个节点,注意这里的节点索引是从0开始的,千万别搞混了哦!
  • 第三列为value,表示连接线的宽度值,数值越大,发出的线条就会越宽!

绘图

library(networkD3)
sankeyNetwork(# 指定links和nodes信息:
    		  Links = links, 
              Nodes = nodes,
    		  # 指定source、target、value以及nodeID对应的列名;
              Source = "source", Target = "target",
              Value = "value", NodeID = "name",
    		  # 设置字体和节点的宽度
              fontSize= 12, nodeWidth = 30)

image-20211214215019063

没错,就是这么简单,这样一个最简单的桑基图就出来啦!

使用自己的数据

############### 使用自己的数据 #############################
links <- read.csv("links.csv",header = T, fileEncoding = "UTF-8-BOM")
nodes <- read.csv("nodes.csv", header = F, fileEncoding = "UTF-8-BOM")

links$target <- links$target -1
colnames(nodes) <- "name"

sankeyNetwork(Links = links, Nodes = nodes, 
              # 指定source、target、value和name:
              Source = "source",
              Target = "target", 
              Value = "value", 
              NodeID = "name", # 节点的名字
              # 调整配置:
              fontSize = 12, # 节点的字体大小
              nodeWidth = 30, # 节点的宽度
              nodePadding = 8 # 节点之间的距离
)

image-20211214215433904

最后,欣赏一波超多层节点的复杂桑基图吧!

######################### 复杂桑基图 ##############################
nodes <- read.csv("nodes1.csv",row.names = 1, header = T, fileEncoding = "UTF-8-BOM")
links <- read.csv("links1.csv",header = T, fileEncoding = "UTF-8-BOM")

# Plot
sankeyNetwork(Links = links, Nodes = nodes, Source = "source",
              Target = "target", Value = "value", NodeID = "name",
              units = "TWh", fontSize = 8, nodeWidth = 30)

fig3

示例数据和代码获取

往期优秀图形目录

渐变火山图

气泡图+相关性热图

复杂提琴图

复杂热图

复杂散点图

复杂热图02

甘特图

百分比柱状图

箱线图美化

弦图

mantel test图

瀑布图

曼哈顿图

KEGG富集图

哑铃图

以上内容仅为群内部分内容,不代表全部。详细目录请看下方列表!已经入群的小伙伴,无需付费购买推文,群内都会及时更新!

示例数据和代码获取

往期文章

生信常用分析图形绘制01 – 各种类型的热图!你学会了吗?
生信常用分析图形绘制02 – 解锁火山图真谛!
生信常用分析图形绘制03 – 富集分析圈图

### 使用 Python 创建桑基图 对于希望在生物信息学项目中创建桑基图数据科学家来说,`matplotlib` 和 `plotly` 是两个常用的库。这些库提供了丰富的功能来构建复杂的图表并支持高度自定义。 #### Matplotlib 库中的 Sankey 图表实现 Matplotlib 的 `Sankey` 类可以用来绘制简单的桑基图: ```python from matplotlib.sankey import Sankey import matplotlib.pyplot as plt fig = plt.figure(figsize=(8, 9)) ax = fig.add_subplot(1, 1, 1, xticks=[], yticks=[], title="Simple Sankey Diagram") # 添加流 sankey = Sankey(ax=ax, scale=0.01) # 定义流量及其连接方式 sankey.add(flows=[0.25, 0.15, 0.60, -0.20, -0.75, -0.15], labels=['', '', '', 'First', 'Second', 'Third'], orientations=[-1, 1, 0, 1, 0, -1]) diagrams = sankey.finish() plt.show() ``` 这段代码展示了如何利用 `matplotlib` 来快速成一个基础版本的桑基图[^1]。 #### Plotly 库用于交互式桑基图 Plotly 提供了一种更现代的方式去制作具有互动特性的桑基图,非常适合于探索性和报告性质的工作。下面是一个简单例子说明怎样使用 plotly.express 绘制桑基图: ```python import pandas as pd import plotly.graph_objects as go data = dict( node=dict(pad=15, thickness=20, line=dict(color="black", width=0.5), label=["A1", "A2", "B1", "B2", "C1", "C2"], color=["blue", "red", "green", "purple", "#FFD700", "#DC143C"]), link=dict(source=[0, 1, 0, 2, 3, 3], # 节点索引列表 target=[2, 3, 3, 4, 4, 5], value=[8, 4, 2, 8, 4, 2])) fig = go.Figure(data=[go.Sankey(valueformat=".0f", valuesuffix="TWh", **data)]) fig.update_layout(title_text="Interactive Sankey Diagram with Plotly", font_size=10) fig.show() ``` 此段脚本不仅能够显示静态图像,还允许用户点击放大查看细节部分,极大地增强了用户体验和理解力[^2]。 #### PySankey 库简化流程分析 除了上述两种主流方案外,还有专门针对桑基图设计的小型第三方库 pySankey 可供选择。它特别适用于处理分类变量间的转移情况,比如基因表达水平变化路径等场景下的应用案例。 安装命令如下所示: ```bash pip install pysankey ``` 之后就可以按照官方文档指导轻松完成相应图形输出了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值