通过箱线图进行判别分析 - R语言实践
箱线图(Box plot)是一种常用的可视化工具,用于展示数据的分布及异常值情况。它可以帮助我们快速了解数据的中位数、上下四分位数、最大最小值等统计指标,并直观地揭示出数据的离散程度。在本文中,我们将使用 R 语言来介绍如何通过箱线图进行判别分析。
首先,我们需要准备一些示例数据。假设我们正在研究三种不同品牌的汽车的耗油量,希望通过箱线图比较它们的差异。我们在R中创建一个包含随机数据的数据框,其中每个品牌的耗油量都有100个观测值。
# 创建示例数据
set.seed(123)
brand1 <- rnorm(100, mean = 8, sd = 1.5)
brand2 <- rnorm(100, mean = 10, sd = 2)
brand3 <- rnorm(100, mean = 12, sd = 1)
data <- data.frame(
Brand = rep(c("Brand 1", "Brand 2", "Brand 3"), each = 100),
Consumption = c(brand1, brand2, brand3)
)
接下来,我们可以使用 ggplot2
包来创建箱线图。这个包提供了丰富的函数和图形参数,可以帮助我们自定义箱线图