
20世纪80年代末期,数据仓库技术兴起。自Ralph Kimball 于1996 年首次出版The Data Warehouse Toolkit(Wiley)一书以来,数据仓库和商业智能(Data Warehousing and Business Intelligence, DW/BI)行业渐趋成熟。Kimball提出了数据仓库的建模技术–维度建模(dimensional modelling),该方法是在实践观察的基础上开发的。虽然它不基于任何理论,但是在实践中却非常成功。维度建模被视为设计数据仓库和数据集市的主要方法,对数据建模和数据库设计学科有着重要的影响。时至今日,维度建模依然是构建数仓首选的数据建模方法,但是随着技术的发展,获取超强的存储与计算能力的成本会变得很廉价。这在无形之中对传统的维度建模方法产生了一定的影响。本文将讨论以下内容:
- 维度建模的概念
- 维度建模的优缺点
- 为什么星型模型依然有用
- 数据建模发生了哪些变化
规则是用来被打破的
First learn the rules, then break them
维度建模的概念
事实表
事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计,通过获取描述业务过程的度量来表达业务过程,包含了引用的维度和与业务过程有关的度量。
事实表中一条记录所表达的业务细节程度被称为粒度。通常粒度可以通过两种方式来表述:一种是维度属性组合所表示的细节程度;一种是所表示的具体业务含义。
作为度量业务过程的事实,一般为整型或浮点型的十进制数值,有可加性、半可

本文探讨了维度建模在大数据时代的地位,包括其概念、优缺点及适用场景。尽管技术发展带来了存储和计算的变革,但星型模型因其易于理解和扩展性仍具价值。同时,数据建模出现了缓慢变化维、维度快照等新趋势,表明维度建模正适应变化并持续演进。
最低0.47元/天 解锁文章
7万+

被折叠的 条评论
为什么被折叠?



