- 博客(2)
- 资源 (4)
- 收藏
- 关注
原创 Kimball多维模型的四大误解
很久没看模型方面的理论知识,最近3年在互联网公司琢磨前行,遇到了很多坑和自我否定或迷惑的状态。就多维模型来说,被传统行业洗礼,还有误人子弟的网上文章和CUBE工具,把kimball带入了一个万劫不复的误区。我是幸运的,而且逃离了这个误区。接下来讲解一下我亲身经历的(Raph总结的)四大误区:一、维度模型只包含汇总数据原因:完全是被某些cube工具带偏了对kimball的理解。如Kylin, 只能选择5~10个维度构建cuboid。事实上,多维模型首先是把某个业务过程,基于最细粒度构建维度化模型。互联
2020-07-22 20:33:56
691
原创 【老贝伏枥】数据仓库为什么要分层
@老贝伏枥】数据仓库为什么要分层【老贝伏枥】数据仓库为什么要分层背景今天有位同事问了一个很原始的问题,数仓为什么要分层?每一层作用是什么?N个为什么,还真把人问懵了,虽然说出了点理由,却显得说服力不足。今天重新把这些理论,捋一捋。分层的作用优秀可靠的数仓体系,需要清晰的数据分层结构。即要保证数据层的稳定又要屏蔽对下游的影响,并且要避免链路过长。结合这些原则及以往的工作经验,我们将分层进行...
2020-04-18 19:22:02
538
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人