CDA Level 1 数据分析师:2.4 表结构数据的使用方法
1. 表结构数据的横向合并
将不同表中的字段信息合并到同一个表中使用
1. 通过公共字段匹配
具有相同的记录值的字段(如两个表都有:相同的字段值(不是字段名),允许不一一对应)
2. 左表与右表
对于SQL: A join B A为左表 B为右表
连接方向:
1. 左连接:left join 左表为主表,左表应该出ID
2. 右连接:right join 右表为主表,右表应该出ID
3. 内连接: inner join 没有主副之分,只保存公共的区域
3. 对应关系
决定连接结果行数是对项乘积的结果
一对多,多对一,多对多
一般选择一对多的连接方式(主键→非主键)
4. E-R 图
多表连接的鸟瞰图
2. 表结构数据的纵向合并
多表中的记录合并到同一个表中使用的合并方式称为纵向合并
1. 去重合并(UNION)和全合并(UNION ALL)
2. 满足条件:
1. 字段个数相同(列相同)
2. 相同字段的类型相同
3. 表结构数据的汇总
数据透视:对零散数据进行汇总的分析
1. 维度:业务观测角度 (员工)分组依据
2. 度量:业务行为结果 (销售金额)
3. 汇总计算规则:衡量业务好坏 (对销售金额求SUM)聚合规则
透视图可以在零散的表格记录中汇总:各个员工的销售业绩