
数仓
西安人走哪都要吃泡馍
这个作者很懒,什么都没留下…
展开
-
三种常见的维度建模:星型,雪花,星座-----详解
星型模型:一张事实表,周围散列多张维度表,维度表都是一级雪花模型:与星座相反,维度表有的是有多级,这样会带来更多表的join操作,不利于性能星座模型:随着业务发展,有多张事实表,其中某些维度表数据是多张事实表共用。星座模式是星型模式延伸而来,星型模式是基于一张事实表的,而星座模式是基于多张事实表的,而且共享维度信息。...原创 2020-06-01 19:02:45 · 4863 阅读 · 0 评论 -
数据仓库为什么要分层?如果不分层可以吗?
数据仓库为什么要执行分层1 清洗数据结构,2 数据血缘追踪,3 减少重复开发4 任务分解,复杂拆分成多个小步骤来实现5 屏蔽原始数据的异常,避免造成数仓跟着大动作的修改如果不分层可以吗?不分层在技术实现以及理论上是可行,但是会有很多弊端,比如工作的重复,一个指标可能从数据清洗到最终数据导出会在一条sql中完成,或者自己实现分阶段落地,但是每个指标可能阶段不同导致后期维护难度增大。所以实际中企业都遵守约定俗成的分层规则。...原创 2020-06-01 18:55:25 · 755 阅读 · 0 评论