整合元数据

1.整合元数据

集成过程中从整个企业范围内收集和整合元数据,包括从企业外部

获取的数据中的元数据。元数据存储库应将提取的技术元数据与相关的

业务、流程和管理元数据集成在一起,可以使用适配器、扫描仪、网桥应用程序或直接访问源数据存储中的方式来提取元数据。第三方厂商的

软件工具和元数据整合工具都提供采集适配器程序。在某些情况下,需

要通过API来开发适配器。

元数据整合过程中可能存在一些挑战,也可能需要诉诸数据治理流

程进行协调解决,例如,在对内部数据集、外部数据(如政府统计数

据)、非电子形式数据(如白皮书、杂志文章或报表)进行整合时,可

能会出现大量的质量和语义方面的问题。

对元数据存储库的扫描有两种不同的方式:

1)专用接口。采用单步方式,扫描程序从来源系统中采集元数

据,直接调用特定格式的装载程序,将元数据加载到元数据存储中。在

此过程中,不需要输出任何中间元数据文件,元数据的采集和装载也是

一步完成的。

2)半专用接口。采用两步方式,扫描程序从来源系统中采集元数

据,并输出到特定格式的数据文件中。扫描程序只产生目标存储库能够

正确读取和加载的数据文件。数据文件可以被多种方式读取,所以这种

接口的架构更加开放。

在此过程中,扫描程序产生和使用多种类型文件:

1)控制文件。包含数据模型的数据源结构信息。

2)重用文件。包含管理装载流程的重用规则信息。

3)日志文件。在流程的每一阶段、每次扫描或抽取操作生成的日

志。

4)临时和备份文件。在流程中使用或做追溯流程所使用的文件。

可以使用一个非持久的元数据暂存区进行临时和备份文件的存储,

暂存区应支持回滚和恢复处理,并提供临时审计跟踪信息,这样有助于

存储库管理员追踪元数据来源或质量问题。暂存区可以采用文件目录或

数据库的形式。

数据仓库和商务智能所使用的数据整合工具通常也适用于元数据整

合(参

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

手把手教你学AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值