黑马Hive+Spark离线数仓工业项目--数仓事实层DWB层构建(1)

整体目标:构建数仓中的DWB:主题事务事实表

核心的主题事实的构建:SQL实现 + 主题的指标

原始事务事实数据【DWD】:订单数据

 主题事务事实数据【DWB】:订单主题

    - 主题周期快照事实表:数据应用层【ST:维度【DWS】 + 事实指标【DWB】】

分层回顾

目标:回顾一站制造项目分层设计

实施

  - ODS层 :原始数据层:101张表:AVRO
  - DWD层:明细数据层:101张表:ORC
  - DWS层:维度数据层:维度表
  - DWB层:轻度汇总层:Join + 构建基础指标

DWB层的设计

目标:掌握DWB层的设计

路径

  - step1:功能
  - step2:来源
  - step3:需求

实施

  功能:存储每个事实主题需要的事务事实数据以及轻度聚合的结果,供ST层基于DWS层进行统计聚合得到最终每个主题的指标
    - 关联:将事实主题需要的字段进行关联合并到一张事实表中,构建基于主题的事实
    - 聚合:对常用的基础指标基于细粒度实现轻度聚合

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值