企业信息工厂中的元数据管理:平衡共享与自主
1. 元数据管理的自主方法及其问题
在元数据管理中,有一种自主方法。在这种方法下,每个环境和工具都有自己独特的元数据解释机制,环境中不存在任何类型的约束,完全处于自主状态。这种自主性对于决策支持系统(DSS)分析师来说有一定吸引力,因为没有人或权威机构告诉他们该做什么。
然而,这种自主方法也引发了一系列问题:
- 当一个DSS用户想知道数据在其他地方是如何定义和使用时,会发生什么?
- 当一个DSS用户想知道一个数据单元的含义时,会怎样?
- 当一个DSS用户想将结果与另一个DSS分析师的结果进行关联时,情况如何?
- 当一个DSS分析师需要将结果与提供分析数据的源系统进行协调时,该怎么办?
- 当数据的解释不一致时,哪个利润数字是正确的?
最终,这种自主环境会导致混乱,整个环境中找不到任何统一性或凝聚力。这种纯粹的自主环境和中央存储库环境一样,既不实际也不可行。
2. 实现共享与自主的平衡
对于想要使企业信息工厂(CIF)成为专业组织化环境的架构师来说,上述两种方法(完全自主和中央存储库)从长远来看都不可接受。为了取得成功,CIF架构师必须在共享元数据的合理需求和自主性需求之间找到平衡。
要实现这种平衡,需要一种不同的元数据视角,即分布式元数据。如图所示,架构中每个组件的元数据必须分为可共享元数据和自主元数据。元数据需要在CIF的各个组件中进行划分:
- 应用程序
- 运营数据源(ODS)
- 数据仓库
- 数据集市
- 探索/数据挖掘仓库
此外,每个节
企业元数据管理:共享与自主平衡
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



