维度一致性:数据仓库的关键要素
1. 维度一致性概述
维度表在具备支持跨钻取所需的兼容性时,就成为了一致性维度。相同的维度能确保一致性,但一致性也有其他多种形式。事实表和一致性维度可以通过矩阵格式进行规划和记录,为逐步实施提供蓝图。
维度一致性有以下几种类型:
- 共享维度表
- 一致性汇总
- 一致性退化维度
- 重叠维度
2. 共享维度表
当两个星型模型共享同一个逻辑维度表时,就出现了最明显的维度一致性形式。这个共享维度可以是同一个物理表,也可以由两个或多个相同的表组成。如果以两个或多个相同的表实现,共享维度必须具备以下特征:
- 表结构相同。
- 表内容相同。
当两个或多个维度表满足这些要求时,就称这些表是一致的。
2.1 共享维度表的优势
共享维度表支持使用其任何维度属性在相关事实表之间进行跨钻取。结构和内容相同的独立维度表也支持在事实表之间进行跨钻取,这些相同的副本是一致的。例如,订单和发货的事实表共享日期、产品和客户维度表,只要它们在结构和内容上相同,就可以支持订单和发货的比较。
2.2 共享维度表的更新
当一致性维度以独立的物理表实现时,应使用单个ETL过程根据新的和更改的源数据对其进行更新。可以先更新主表,然后将其复制到各个物理位置,这样可以确保副本相同,减少重复处理,并保证在使用副本进行分析时得到准确的结果。对于较大的表,复制可能不实用,此时单个ETL过程应识别新的和更改的行,进行一次键管理,并将更改应用到每个副本。
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



