可视化销售数据的实用方法
1. 用箱线图绘制分解数据
在向不熟悉统计的人展示结果时,条形图很有用。但条形图会聚合信息,这意味着实际上我们会因这种聚合而丢失一些信息。如果与理解四分位数的人合作,箱线图可能是一种有用的可视化方式,它能让我们轻松看到变量不同水平的个体分布。
1.1 箱线图的构成
每个箱线图的底部代表第一四分位数,顶部代表第三四分位数,中间的线代表中位数。垂直延伸的线可达 1.5 倍四分位距(IQR,即第一和第三四分位数之间的距离)内的任何观测值。超出 1.5 倍 IQR 的观测值被视为异常值,并单独显示。
1.2 绘制箱线图的函数
以下是绘制箱线图的函数代码:
HSBQI@UPQ@O@CPYQMPUT <- function(EBUB, Y, Z, O, G = "#5685F8", D = "#1D69A3") {
EBUB <- GJMUFS@O@UPQ(TBMFT, O, Y)
return(
ggplot(EBUB, aes_string(Y, Z)) +
geom_boxplot(fill = G, color = D) +
ggtitle(paste(Z, "by", Y, "Top", O))
)
}
1.3 筛选数据的函数
GJMUFS@O@UPQ <- function(EBUB, O, CZ) {
BHHS <- aggregate(EBUB$13
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



