数据仓库中一致性维度的深度解析
1. 数据仓库架构与一致性概述
在数据仓库的构建中,除了在特定阶段实现分析协同效应外,基础设施也可得到简化。例如,“日”维度在首个项目中开发一次即可,后续项目所需构建的维度表可能远少于早期项目,但这需要前期进行一定的分析。
不同的数据仓库架构对一致性的重视程度有所不同:
- Kimball 的维度数据仓库 :基于维度模型,一致性是其核心特征。
- Inmon 的企业信息工厂 :不依赖维度模型来集成企业数据,因此对一致性的重视程度相对较低。
- 独立数据集市 :从定义上缺乏企业级上下文,虽内部维度可能一致,但与其他数据集市可能存在不兼容问题。
2. 维度数据仓库
维度数据仓库架构依赖星型模式作为原子数据的集成存储库,数据集市是该维度存储库的子集、派生的维度结构或两者的组合。一致性维度是实现企业级范围的关键,它作为集成主题领域的基础设施,因此维度设计(包括一致性计划)必须作为战略前期流程来开展。
2.1 战略规划包含一致性设计
在维度数据仓库中,维度设计是一项战略活动,而非设计阶段的活动,需在任何实施项目开始前进行。维度设计可以作为独立项目开展,也可纳入战略项目,该战略项目还包括建立技术架构、选择工具和确定实施优先级等活动。
维度模型的一致性框架是维度数据仓库设计的顶层重点,Kimball 和 Ross 将其称为一致性总线。它使模型既能满足每个主题领域的需求,又能保留比较主题领域的能力,是支持企业级范围、实现微观和宏观层面流
数据仓库一致性维度解析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



