报表自动化: 事实、维度与指标的三方会谈

本文探讨报表自动化中事实、维度和指标的存放、依赖关系及其设计。介绍强ETL和弱ETL方案,强调避免跨层调用以保持数据仓库的层次清晰。同时讨论了维度和指标的分层,以及如何在设计阶段建立良好的基础以减少后期重构成本。

前面的《报表自动化: 没有压力的维度建模》以及《报表自动化: 薅出数字背后的价值》两篇文章分别提及了维度建模中的事实维度,以及指标三种表,那么他们之间具体有什么关系呢?前面都零星提到了一些,现在让我们来具象化的了解一下这个关系。

存放在哪

继续上之前手残画的图:

image-20200226211739979

其中模型,在维度建模中就是事实和维度了,为这张图已经直观的展示出了三者放在那里了:

  • 简单的情况:DW 库存放事实和维度,DM 库存放指标
  • 复杂的情况:DW 存放事实和维度,同时存放不同团队、业务、产品公用的通用指标;DM 各个业务、产品的仓库拉取需要用到的 DW 库里的模型以及通用指标,并构建一定的专用模型以及大量的自己的专用指标
  • 极简的情况:也许根本就没有区分 DW、DM 两层数据库,一个库里搞定了

上面提到了通用、公用的概念,这就类似于 JAVA 代码或者说是我们常规的后端服务开发代码里面的抽取重复代码了,但是在数仓里面的抽取要注意:逐层下沉,满足复用需要即可

依赖关系

上面只显示了各层数据库要如何存放,那么他们是如何构建成这个层次分明的金字塔呢?

强 ETL 方案

先来展示一种在流程上来说简单的依赖方式,这种方案里的 ETL 工

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值