星型模式:数据仓库中的多维数据分析利器
1. 星型模式简介
星型模式是一种数据建模技术,用于将多维决策支持数据映射到关系数据库中。它实际上是在现有的关系数据库基础上创建了一个近乎等效的多维数据库模式。星型模式在保留操作型数据库所基于的关系结构的同时,为多维数据分析提供了一个易于实现的模型。其基本组成部分包括事实、维度、属性和属性层次结构。
2. 事实(Facts)
事实是代表特定业务方面或活动的数值度量(值)。例如,销售数字就是代表产品和服务销售的数值度量。在业务数据分析中常用的事实包括数量、成本、价格和收入等。事实通常存储在事实表中,事实表是星型模式的中心。事实表中的事实通过维度相互关联,维度将在接下来的部分进行解释。
事实也可以在运行时进行计算或推导,这种计算或推导得出的事实有时被称为指标(metrics),以区别于存储的事实。事实表会定期使用操作型数据库中的数据进行更新。
3. 维度(Dimensions)
维度是为给定事实提供额外视角的限定特征。决策支持数据几乎总是与其他数据相关联进行查看,因此维度非常重要。例如,销售数据可能会按产品在不同地区和不同时间段进行比较。商业智能(BI)系统通常解决的问题可能是比较 2010 年至 2020 年第一季度各地区产品 X 的销售情况。在这个例子中,销售数据具有产品、位置和时间维度。实际上,维度就像是研究事实的放大镜。这些维度通常存储在维度表中。
以下是一个简单的星型模式示例:
| 维度类型 | 具体示例 |
| ---- | ---- |
| 产品维度 | HP 计算器 |
| 时间维度 | 2021 年
超级会员免费看
订阅专栏 解锁全文
1016

被折叠的 条评论
为什么被折叠?



