带有随机扰动数据点的水平半小提琴图(使用R语言)
在数据可视化中,水平半小提琴图是一种常用的图表类型,可以同时显示出数据分布的密度和箱线图的统计信息。本文将介绍如何使用R语言创建一个带有随机扰动数据点的水平半小提琴图。
在开始之前,我们需要先准备一些随机的、符合正态分布的数据,并为其添加一些随机扰动数据点。我们可以使用以下代码生成这些数据:
set.seed(123) # 设置随机数种子,保证结果可重现
# 生成正态分布的数据
data <- rnorm(1000, mean = 50, sd = 10)
# 添加随机扰动数据点
noise <- rnorm(100, mean = 0, sd = 25)
index <- sample(1:1000, 100)
data[index] <- data[index] + noise
通过上述代码,我们生成了一个包含1000个数据点的正态分布数据,并从中随机选取了100个数据点,为其添加了随机扰动。
接下来,我们使用ggplot2包来创建水平半小提琴图。首先,我们需要安装并加载ggplot2包:
install.packages("ggplot2")
library(ggplot2)
然后,使用以下代码创建水平半小提琴图:
ggplot(data, aes(x = data)) +
geom_violin(fill = "lig