R语言绘制基础分组水平箱图实战
在数据可视化中,箱线图是一种常用的工具,用于展示连续变量的分布情况。而ggplot2包是一个功能强大且易于使用的工具包,可以帮助我们以优雅的方式创建各种类型的图形。本文将介绍如何使用ggplot2包中的geom_boxplot函数来绘制基础分组水平箱图。
首先,我们需要准备一组适合创建箱线图的数据。假设我们有一份关于学生数学成绩的数据集,其中包含了两个不同班级的成绩数据。我们的目标是比较这两个班级的成绩分布情况。
首先,让我们加载所需的库和数据集:
# 加载必要的库
library(ggplot2)
# 创建示例数据
set.seed(123)
class1 <- rnorm(50, mean = 70, sd = 5)
class2 <- rnorm(50, mean = 75, sd = 5)
data <- data.frame(Class = rep(c("Class 1", "Class 2"), each = 50),
Score = c(class1, class2))
我们生成了两个正态分布的随机数向量,模拟了两个班级的成绩数据,并将它们合并到一个数据框中。
接下来,我们使用ggplot2包中的geom_boxplot函数来创建箱线图。在绘制箱线图时,我们需要指定x变量和y变量,并使用fill参数来区分不同的班级。
# 创建基础分组水平箱图
ggplot(data, aes(x = Class, y =