元数据在数据仓库中的应用与管理
1. 元数据的重要性
元数据在数据仓库中扮演着至关重要的角色,主要体现在以下几个方面:
- 描述与解释数据 :帮助用户更好地理解数据仓库中的数据和结构,从而更有效地使用数据仓库。例如,数据定义元数据能让新用户理解每个事实和维度属性的含义及示例值,避免现有用户对某些列的含义产生误解。
- 审计目的 :用于了解数据仓库中发生的事件,包括事件发生的时间、地点和过程。当ETL过程意外停止时,审计元数据可以帮助我们确定哪些步骤已执行、执行结果如何以及哪些步骤未执行,从而找出故障点并使ETL过程下次能从故障点恢复。
- 支持系统操作任务 :系统利用元数据执行操作任务,如在数据质量规则检测到“坏数据”时确定所需的操作,以及确定ETL任务的执行顺序。
- 提高可维护性 :通过在元数据数据库中使用规范化形式,将表名和列名存储在数据结构元数据中,其他元数据通过存储表键和列键来引用数据结构元数据。这样,当需要更改元数据数据库中的某些内容时,只需修改一处即可。
2. 数据定义和映射元数据
- 数据定义元数据 :是DDS、ODS和NDS(取决于所选架构)中每个表的所有列的列表,包含列的含义和示例值。它使用数据结构元数据中定义的表键和列键,而不是直接提及数据存储名称、表名和列名。
- 映射元数据 :描述了每个数据项在源系统中的来源,也称为数据沿袭元数据。如果映射元数据仅包含源系统
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



