使用复杂对应关系集成关系数据源
数据集成(DI)旨在将一组异构、自主的数据源组合起来,为用户提供这些数据的统一视图。在数据集成过程中,设计人员常常会遇到数据模型不兼容的问题,这些问题主要体现在结构和语义上的差异。其中,定义模式元素(如属性)之间的对应关系,以确定它们之间的关联方式,是最具挑战性的任务之一。
1. 数据集成概述
数据集成系统的目标是整合来自不同数据源的数据,并提供统一视图。实现这一目标主要有两种方式:
- 物化数据集成 :将数据物理地整合到一个存储库中,数据仓库系统就是这种方式的典型代表。
- 虚拟数据集成 :数据仍然保留在各个数据源中,只有在向数据集成系统提出查询时才进行整合,联邦信息系统和中介系统属于这种方式。
在数据集成中,模式映射问题是一个关键难题,它主要包括两个任务:
- 模式匹配 :定义或生成模式元素之间的对应关系。
- 模式映射 :找到数据转换方法,将源模式的数据实例转换为目标模式的数据实例。
模式匹配的结果是一组对应关系,这些对应关系可以使用局部视图(LAV)、全局视图(GAV)或全局和局部视图(GLAV)语言来描述。一旦完成模式匹配,就可以利用这些对应关系生成模式映射,例如通过 SQL 查询将源数据转换为可存储在目标中的数据。
2. 模式匹配研究现状
近年来,模式匹配领域开展了大量研究。大多数研究主要关注两个模式元素之间的 1 - 1 对应关系,这种匹配方式被称为基本匹配。然而,基本匹配忽略了许多
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



