数据仓库架构迁移:从混乱到有序
1. 数据模型同步
1.1 数据模型比较
在数据建模过程中,每个数据建模者都有自己对企业的看法。完整的业务数据模型具有更广泛的视角,它代表整个企业,而系统数据模型代表数据仓库或应用系统的整个范围。建模者可能会在不知情的情况下对模型的其他方面产生影响,碰撞管理过程可以识别这些影响。
在将更改导入基础模型之前,会使用一种称为碰撞管理的技术来比较基础模型和更改后的模型。该技术会寻找两个模型之间的差异,并将其识别出来。负责整体模型管理的人员可以审查识别出的差异,并指示哪些差异应被吸收到基础模型中。这一步骤还提供了一个检查点,以确保系统模型中的更改能在业务模型中得到适当反映。任何未被纳入的更改都应与建模者进行讨论。
1.2 更改合并
过程的最后一步是合并更改。一旦负责管理基础模型的人员做出合并更改的决定,这些更改就会被合并。每个建模工具处理此过程的方式略有不同,但大多数都提供了一定程度的自动化。
1.3 数据模型同步的重要性
各种数据模型的同步对于实现数据仓库的一个主要目标——数据一致性至关重要。业务数据模型被用作所有后续模型的基础,最终部署在数据库中的每个数据元素都与业务数据模型中的定义元素相关联。这种关联确保了一致性,并显著简化了构建数据仓库时的集成和转换活动。
各个数据模型可能会因各种原因发生变化。主题领域模型和业务数据模型的更改主要由业务变化驱动,而其他模型的修订主要由这些变化的影响和部署决策驱动。由于缺乏能够自动化整个过程的工具,保持模型同步的挑战更加严峻。最困难的任务是使业务数据模型与较低级别的模型保持同步,但正如我们所见,这种同步是保
超级会员免费看
订阅专栏 解锁全文
11

被折叠的 条评论
为什么被折叠?



