星型模式:数据仓库中的多维数据建模技术
在数据仓库领域,星型模式是一种至关重要的数据建模技术,它能够将多维决策支持数据映射到关系数据库中,为数据分析师提供了一种高效且易于实现的多维数据分析模型。下面将详细介绍星型模式的各个组成部分及其相关概念。
1. 星型模式概述
星型模式是一种数据建模技术,用于将多维决策支持数据映射到关系数据库中。它通过一个中心表(事实表)与多个维度表建立 1:M 关系来表示数据。星型模式的基本组成部分包括事实、维度、属性和属性层次结构。
2. 事实(Facts)
事实是代表特定业务方面或活动的数值测量(值)。在商业数据分析中,常用的事实包括单位、成本、价格和收入等。例如,销售数字就是代表产品或服务销售的数值测量。事实通常存储在事实表中,事实表是星型模式的中心。事实表中的事实通过维度相互关联。
事实还可以在运行时进行计算或推导,这种计算或推导的事实有时被称为指标(Metrics),以区别于存储的事实。事实表会定期使用运营数据库中的数据进行更新。
3. 维度(Dimensions)
维度是为给定事实提供额外视角的限定特征。决策支持数据几乎总是与其他数据相关联进行查看,因此维度非常重要。例如,销售数据可以按产品、地区和时间进行比较。在一个 BI 系统中,常见的问题可能是比较 2010 年至 2020 年第一季度各地区产品 X 的销售情况。在这个例子中,销售数据具有产品、位置和时间维度。维度通常存储在维度表中。
以下是一个简单的星型模式示例,展示了销售数据的产品、位置和时间维度:
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



