报表自动化: 事实、维度与指标的三方会谈

最新推荐文章于 2025-04-27 17:32:11 发布

原创

最新推荐文章于 2025-04-27 17:32:11 发布 · 733 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。个人博客地址www.techieliang.com

文章标签：

#数据可视化 #数据库 #大数据 #人工智能

本文探讨报表自动化中事实、维度和指标的存放、依赖关系及其设计。介绍强ETL和弱ETL方案，强调避免跨层调用以保持数据仓库的层次清晰。同时讨论了维度和指标的分层，以及如何在设计阶段建立良好的基础以减少后期重构成本。

前面的《报表自动化: 没有压力的维度建模》以及《报表自动化: 薅出数字背后的价值》两篇文章分别提及了维度建模中的事实、维度，以及指标三种表，那么他们之间具体有什么关系呢？前面都零星提到了一些，现在让我们来具象化的了解一下这个关系。

存放在哪

继续上之前手残画的图：

其中模型，在维度建模中就是事实和维度了，为这张图已经直观的展示出了三者放在那里了：

简单的情况：DW 库存放事实和维度，DM 库存放指标
复杂的情况：DW 存放事实和维度，同时存放不同团队、业务、产品公用的通用指标；DM 各个业务、产品的仓库拉取需要用到的 DW 库里的模型以及通用指标，并构建一定的专用模型以及大量的自己的专用指标
极简的情况：也许根本就没有区分 DW、DM 两层数据库，一个库里搞定了

上面提到了通用、公用的概念，这就类似于 JAVA 代码或者说是我们常规的后端服务开发代码里面的抽取重复代码了，但是在数仓里面的抽取要注意：逐层下沉，满足复用需要即可

依赖关系

上面只显示了各层数据库要如何存放，那么他们是如何构建成这个层次分明的金字塔呢？

强 ETL 方案

先来展示一种在流程上来说简单的依赖方式，这种方案里的 ETL 工

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。