现有应用中的数据构成了主数据管理工作的基础,理解这些数据的
结构和内容以及收集或创建数据的过程是很重要的。主数据管理工作的
结果之一可能是通过评估现有数据的质量来改进元数据。评估数据源的
目标之一是根据组成主数据的属性来了解数据的完整性。这个过程包括
阐明这些属性的定义和粒度。在定义和描述属性时,有时会遇到语义问
题,数据管理员需要与业务人员协作,并就属性命名和企业级定义达成
一致(参见第3章和第13章)。评估数据源的另一目标是了解数据的质
量。数据质量问题会使主数据项目复杂化,因此评估过程应该包括找出
造成数据问题的根本原因并解决问题。不要想当然地认为数据是高质量的——假定数据质量不高才比较稳妥,应将评估数据质量及其与主数据
环境的适配性的工作常态化。
正如上文提到的那样,最大的挑战是数据源之间的差异。在任何给
定的数据源中,数据可能都是高质量的,但由于结构差异以及表示相似
属性的值的差异,这些数据还是不能很好地整合在一起。数据是在应用
程序中被创建和收集的,而主数据计划提供了在这些应用程序中定义和
实现标准的机会。
对于某些主数据实体,如客户、顾客或供应商,可以购买标准化数
据(如参考目录),以实现主数据管理工作。有些供应商可以提供与个
人、商业实体或专业人士有关的高质量数据(如卫生保健专业人员),
这些数据可以与组织内部的数据进行比较,以此来改善组织内存储的联
系信息、地址和名称等数据的质量(参见第10章)。除了评估现有数据
的质量外,还必须了解支持主数据管理工作的输入采集技术,现有技术
将影响主数据管理的架构方法。
3.定义架构方法
主数据管理的架构方法取决于业务战略、现有数据源平台以及数据
本身,特别是数据的血缘和波动性以及高延迟或低延迟的影响。架构必
须要考虑数据消费和共享模型。维护工具取决于业务需求和架构选项。
工具有助于定义数据管理和维护的方法,同时也依赖于管理和维护的方
法。
在抉择整合方法时,需要考虑整合到主数据解决方案中的源系统的
数量和这些系统所需的平台。组织的规模和地域分布也会影响整合方法
的选择。小型组织可以有效地利用交易中心模式,而具有多个系统的全
球性组织更有可能选择注册表模式。如果一个组织兼有“孤立”的业务部
门和各种各样的源系统,那么他可能会决定使用一种综合的方法进行统
一整合。业务领域专家、数据架构师和企业架构师应该就各种方法提出
自己的意见