R语言数据可视化:使用ggplot2绘制散点图并添加椭圆注释
在数据分析和可视化中,散点图是一种常用的方法,用于展示两个变量之间的关系。R语言中的ggplot2包提供了强大而灵活的功能,可以轻松创建高质量的散点图。本文将介绍如何使用ggplot2绘制散点图,并使用geom_mark_ellipse函数添加椭圆注释。
首先,我们需要安装并加载ggplot2包。可以使用以下命令完成:
install.packages("ggplot2")
library(ggplot2)
接下来,我们需要一个数据集来演示。这里我们使用R中自带的mtcars数据集,该数据集包含了不同汽车的性能指标。我们可以使用以下命令加载数据集并查看前几行:
data(mtcars)
head(mtcars)
在绘制散点图之前,我们可以考虑对数据进行聚类或分组,然后为每个簇或分组添加椭圆注释。这可以帮助我们更好地理解数据的分布特征。
首先,让我们使用k-means算法对数据进行聚类。假设我们将数据分为3个簇。可以使用以下代码完成聚类:
set.seed(123)
kmeans_obj <- kmeans(mtcars[, c("mpg", "wt")], centers = 3)
mtcars$cluster <- as.factor(kmeans_obj$cluster)
这里我们选择了两个变量m