鸢尾花散点图_跟着Nature microbiology学画图~ggplot2散点图添加分组边界

本文将展示如何模仿Nature microbiology论文中的Figure4小b图,利用ggplot2在鸢尾花数据集的主成分分析结果上创建散点图,并添加分组边界。首先介绍数据格式和读入,然后逐步构建基本散点图、美化图表,最后通过特定函数为不同鸢尾花品种添加分组边界。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天要模仿的图片来自于论文 Core gut microbial communities are maintained by beneficial interactions and strain variability in fish。期刊是 Nature microbiology

da1afe2f83a1e60f4902636ed564faef.png
image.png

今天重复论文中Figure4中的小b这幅图

ada9628b6e50929bdf01725fd6d3c509.png
image.png

论文中他实际做的分析是主坐标分析(Principal coordinates analysis of samples),今天的推文内容不涉及分析过程,只讨论作图。用到的示例数据是鸢尾花的数据集做完主成分分析的结果。需要示例数据的可以在文末留言

数据格式
c06a3a521c4daf7a41774484aae26263.png
image.png
第一步读入数据
df'irispca.csv',row.names = 1,header=T)
head(df)
9b91f0343f915009923301064ff0aae3.png
image.png
基本的散点图,根据group分组来映射颜色和形状
library(ggplot2)
ggplot()+
  geom_point(data=df,aes(x=PC1,y=PC2,
                         color=group,shape=group),
             size=2)
c03994896ff41187f02e76f1fe8aa9b8.png
image.png
接下来是一些简单的美化
ggplot()+
  geom_point(data=df,aes(x=PC1,y=PC2,
                         color=group,shape=group),
             size=3)+
  theme_bw()+
  theme(panel.background = element_blank(),
        panel.grid = element_blank(),
        legend.title = element_text(hjust=0.5))+
  labs(x="Coordinate 1 (15%)",y="Coordinate 2 (8%)")+
  scale_color_manual(values = c("#008080","#ffa500","#8b008b"))
b8bbd81eee233477e9937975865586cb.png
image.png
接下来是添加分组边界

添加分组边界主要参考了文章 https://chrischizinski.github.io/rstats/vegan-ggplot2/

添加分组边界用到的是geom_polygon()函数,这里需要借助chull()函数重新构造一份数据。chull()函数是我第一次接触,具体作用我还得在学习一下,用如下代码可以解决问题,但是代码具体的作用我还得再研究一下

比如给setosa这一组数据添加分组边界

构造一份新的数据 集

df1$group=="setosa",][chull(
  df[df$group=="setosa",c("PC1","PC2")]
),]

画图

ggplot()+
  geom_point(data=df,aes(x=PC1,y=PC2,
                         color=group,shape=group),
             size=3)+
  theme_bw()+
  theme(panel.background = element_blank(),
        panel.grid = element_blank(),
        legend.title = element_text(hjust=0.5))+
  labs(x="Coordinate 1 (15%)",y="Coordinate 2 (8%)")+
  scale_color_manual(values = c("#008080","#ffa500","#8b008b"))+
  geom_polygon(data=df1,aes(x=PC1,y=PC2,group=group),
               color="#008080",fill="#008080",alpha=0.2,size=1)
3fe9b36ba20f036cf88c317496af3f9e.png
image.png

按照这个思路再给另外两个品种添加分类边界就好了

library(ggplot2)
table(df$group)
df1$group=="setosa",][chull(
  df[df$group=="setosa",c("PC1","PC2")]
),]
df2$group=="versicolor",][chull(
  df[df$group=="versicolor",c("PC1","PC2")]
),]
df3$group=="virginica",][chull(
  df[df$group=="virginica",c("PC1","PC2")]
),]
ggplot()+
  geom_point(data=df,aes(x=PC1,y=PC2,
                         color=group,shape=group),
             size=3)+
  theme_bw()+
  theme(panel.background = element_blank(),
        panel.grid = element_blank(),
        legend.title = element_text(hjust=0.5))+
  labs(x="Coordinate 1 (15%)",y="Coordinate 2 (8%)")+
  scale_color_manual(values = c("#008080","#ffa500","#8b008b"))+
  geom_polygon(data=df1,aes(x=PC1,y=PC2,group=group),
               color="#008080",fill="#008080",alpha=0.2,size=1)+
  geom_polygon(data=df2,aes(x=PC1,y=PC2,group=group),
               color="#ffa500",fill="#ffa500",alpha=0.2,size=1)+
  geom_polygon(data=df3,aes(x=PC1,y=PC2,group=group),
               color="#8b008b",fill="#8b008b",alpha=0.2,size=1)
d949ad3363b80351857b66ee10362e83.png
image.png

这个图相比于论文中的图还有一个不一样的地方是:他画坐标轴是以(0,0)原点为中心的,那么在ggplot2里应该如何实现呢?欢迎大家留言讨论呀!

欢迎大家关注我的公众号

小明的数据分析笔记本bc347c5ec03a66ea2cc64d49edc5556f.png

示例数据可以直接留言获取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值