数据可视化:解决重叠绘图与添加拟合线
1. 解决重叠绘图问题
1.1 问题描述
当数据集中的点过多时,散点图中的点可能会相互遮挡,导致无法准确评估数据的分布,这种现象被称为重叠绘图。
1.2 解决方法
1.2.1 低程度重叠绘图的解决方法
- 使用更小的点。
- 使用不同的形状,如空心圆(形状 1),以便能看到其他点。
1.2.2 高程度重叠绘图的解决方法
- 使点半透明 :通过设置
alpha值来实现。例如,对于包含约 54,000 个点的散点图:
library(ggplot2)
sp <- ggplot(diamonds, aes(x=carat, y=price))
sp + geom_point(alpha=.1)
sp + geom_point(alpha=.01)
- 将数据分箱为矩形 :使用
stat_bin_2d()函数。默认情况下,它会在 x 和 y 方向将空间分为 30 组,共 900 个箱。可以通过bins参数增加箱的数量,并使用scale_fill_gradient()函数设置颜色。
超级会员免费看
订阅专栏 解锁全文
36

被折叠的 条评论
为什么被折叠?



