数据可视化与图形标注实用指南
1. 带缺口的箱线图
缺口用于箱线图中,以帮助直观评估分布的中位数是否不同。如果缺口不重叠,则表明中位数不同。在处理特定数据集时,可能会看到如下消息:
Notch went outside hinges. Try setting notch=FALSE.
这意味着置信区域(缺口)超出了其中一个箱体的边界(或铰链)。在某些情况下,中间箱体的缺口上半部分会略微超出箱体,但超出量非常小,在最终输出中可能看不到。缺口超出边界本身并没有本质问题,但在极端情况下可能会显得奇怪。
2. 向箱线图添加均值
2.1 问题
希望在箱线图中添加均值标记。
2.2 解决方案
使用 stat_summary() 函数。均值通常用菱形表示,因此使用形状 23 并填充白色。还可以通过设置 size = 3 使菱形稍大一些。示例代码如下:
library(MASS) # 加载数据集
ggplot(birthwt, aes(x = factor(race), y = bwt)) +
geom_boxplot() +
stat_summary(fun.y = "mean", geom = "point", shape = 23, size = 3, fill = "white")
超级会员免费看
订阅专栏 解锁全文
1091

被折叠的 条评论
为什么被折叠?



