使用ggplot2包绘制基础分组箱图实战
在数据分析和可视化中,箱图(box plot)是一种常用的统计图形,用于展示数据集的分布情况,包括中位数、上下四分位数、异常值等信息。而R语言中的ggplot2包则提供了丰富的绘图功能,可以轻松绘制出漂亮而信息丰富的箱图。本文将介绍如何使用ggplot2包的geom_boxplot函数进行基础分组箱图的绘制。
首先,我们需要准备一份适用的数据集,以便进行箱图的绘制。这里我们以一个虚构的数据集为例,假设我们正在研究某个产品在两个不同地区的销售情况。数据集包含两个变量:地区(region)和销售额(sales)。我们希望通过箱图来比较两个地区的销售额分布情况。
# 创建数据集
region <- rep(c("A", "B"), each = 100)
sales <- c(rnorm(100, mean = 50, sd = 10), rnorm(100, mean = 70, sd = 15))
data <- data.frame(region, sales)
接下来,我们需要加载所需的库并设置绘图主题。
# 加载ggplot2包
library(ggplot2)
# 设置绘图主题
theme_set(theme_minimal())
现在,我们可以使用ggplot2包来绘制箱图了。首先,我们需要创建一个ggplot对象,并指定数据集和要绘制的变量。
# 创建ggplot对象
p <- ggplot(da