数据整合作为一种资源整合的理念和方式,缘起于20世纪90年代初,是随着企业信息化集成需求出现而逐步发展完善。在企业初期信息化建设过程中,由于缺乏信息化建设统一规划,而建立了由不同核心技术构建的信息系统,这类系统存在各类异构问题,导致企业信息数据不能有效流通和利用。如何通过一套企业资源整合方案,并配合相关系统的实施,将企业内部和外部的异构数据源进行整合,提高资源的利用效率,是当今企业信息化建设面临的挑战。数据整合则是实现信息系统集成的关键和导向,其目标是消除系统的分布性和异构性,以及消除各类数据的语义异构问题,实现异构信息子系统间的信息共享。因此在这一领域,关于数据整合价值、特征、技术等方面的理论与解决方案层出不穷。
数据整合(Data Integration),也称数据集成、数据融合,是对异构资源系统中的异质、异类的数据在逻辑上或物理上有机地集中,提供统一的表示和操作,以解决多种异构数据资源互联与共享[1]。由于在企业信息化建设过程中,主要处理信息系统中存在的数据共享利用问题,因此数据整合又指信息集成和数据集成。
数据整合的本质是通过一定的技术手段,把存在于异构系统中的异构数据,在物理和逻辑上进行集中利用,屏蔽各种数据的差异,让各种数据相互联系,并形成企业全局视图,达到数据共享利用的目的。众多实践表明,数据整合不仅是信息技术上的问题,还是方法论、流程、规则的组合,数据整合工作需要从系统整合、流程与规则整合、元数据整合、服务整合四个层面展开,如图2-1所示: