前言
废话不多说,但是为了和之前的文章保持一致,还是要点废话,嗯哼
多维数据透视分析(10%)
多维数据模型:
多维数据模型定义:又叫多维数据集、立方体,指的是相互间通过某种联系被关联在一起的不同类别的数据集合
多维数据模型创建方法:
相邻两表之间:通过公共字段连接,选择不同表中字段分别作为维度、度量,选择汇总计算规则
(关于维度、度量、汇总计算规则,还不清楚的需要去复习之前的章节呦)
1、影响连接汇总的三要素:
筛选器方向:单向、双向,方向决定维度和度量的出处
对应关系:一对一、多对一、多对多,决定连接汇总的结果
汇总角色:维度、度量
2、 多维数据模型的核心:OLAP
3、相邻两表连接总结语:一对多、一表出维度、多表出度量
4、其他连接方式(必考):
交叉连接:交叉连接下只有一条路径为有效路径
星型模式:一事实表和多维度表
雪花模式:维度表与维度表相连,进行维度的扩展(如:产品表和品牌表)
星座模式:多个事实表共用某些维度表
5W2H思维模型
透视分析方法
基本透视规则:
1、合计规则:将相同维度值下对应多个度量值相加在一起(如:sum等)
2、计数规则:对相同维度值下的度量个数进行计数(COUNT:非空计数;DISINCTCOUNT:去重计数)
3、平均规则:用合计规则的结果除以计数规则的结果(平均=合计/计数;如:AVERAGE)
4、最大值规则:求相同维度之下最大的度量值(如:MAX)
5、最小值规则:求相同维度之下最小的度量值(如:MIN)
平均值陷阱题:
1、average求总平均值(对于重复的订单无法处理)
2、存在重复值,需要:平均=合计/计数(去重)
拓展
对比计算规则应用范围
均比:实际值与平均值的对比(应用:同类型产品销售情况)
基准比:实际值与基准值的对比(应用:成绩水平)
目标比:实际值与基准值的对比(应用:销售业绩绩效)
标准比:实际值与标准值的对比(应用:工厂工作水平绩效)
占比:部分与总体的对比(应用:不同区域营销额占比)