数据可视化:数值与分类数据的统计处理策略
1. 数据可视化概述
在数据可视化中,不同类型的图表能帮助我们从不同角度理解数据。例如,箱线图和直方图的结合,能让我们看到箱线图的构建与底层数据的关系,还能同时了解数据的频率和密度。下面将通过几个实际案例,详细介绍如何运用不同的图表和统计方法来分析数据。
2. 折线图:Office Essentials 案例研究
2.1 构建基本折线图
OE 公司的数据团队需要展示过去几年按月份细分的整体销售数据,以预测未来销售趋势。构建基本折线图的步骤如下:
1. 右键拖动 [Order Date] 到 Columns,选择 Month。
2. 拖动 SUM([Sales]) 到 Rows。
通过这个折线图,我们可以发现数据存在季节性,每年 9 月、11 月和 12 月会出现销售高峰,且总体销售呈上升趋势。
2.2 添加参考分布
为了更准确地传达数据信息,我们可以添加参考分布,即显示置信区间的范围。置信区间是根据随机样本计算出的可能包含所选度量真实值的范围,它与样本大小和置信水平有关。样本越大,置信区间越窄;置信水平越高,区间越宽。添加置信区间的步骤如下:
1. 从 Analytics 窗格中拖动 Average line 到视图,然后放到 Table 上。
2. 聚焦中间部分,添加置信区间并指定置信水平,将 Label 选项改为 Value。
添加置信区间后,图表能让观众更清晰地看到哪些月份的销售高于或低于平均水平。
2.3 添加标准差
我们还可以在折线图中
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



