数仓分层
1.1 ODS层做了哪些事?
1)保持数据原貌,不做任何修改
2)压缩采用LZO,压缩比是100g数据压缩完10g左右。
3)创建分区表
1.2 DWD层做了哪些事?
1.2.1 数据清洗
(1)空值去除
(2)过滤核心字段无意义的数据,比如订单表中订单id为null,支付表中支付id为空
(3)将用户行为宽表和业务表进行数据一致性处理
select case when a is null then b else a end as JZR,
…
from A
1.2.2 清洗...
原创
2021-01-30 17:09:34 ·
930 阅读 ·
3 评论