数据可视化与统计分析入门
1. 数据可视化基础
在进行数据可视化之前,我们需要加载必要的库并读取数据。以下是具体的代码:
# 加载所需库
library(dplyr)
library(ggplot2)
# 清空环境变量
rm(list = ls())
# 读取数据
compensation <- read.csv('compensation.csv')
# 查看数据结构
glimpse(compensation)
接下来,我们可以使用 ggplot2 库创建散点图,代码如下:
# 创建散点图
ggplot(compensation, aes(x = Root, y = Fruit, colour = Grazing)) +
geom_point(size = 5) +
xlab("Root Biomass") +
ylab("Fruit Production") +
theme_bw()
这个散点图展示了根生物量和果实产量之间的关系,并且通过颜色区分了放牧处理。
2. 箱线图的使用
散点图适合展示原始数据,但有时我们需要通过数据的集中趋势(如均值、中位数)和变异估计(如标准差或标准误差)来呈现数据。在生物学中,柱状图很常见,但最近的讨论表明,这种展示方式会隐藏太多信息,不太适合。因此,我们推荐使用箱线图。
以下是创建箱线图的代码:
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



