37、数据库集成与多数据库系统:原理、技术与实践

数据库集成与多数据库系统:原理、技术与实践

1. 数据库集成概述

数据库集成是一种自下而上的数据库设计过程,其核心在于创建全局概念模式(GCS)或中介模式,并明确各个局部概念模式(LCS)与它的映射关系。在这个过程中,存在两种主要的数据集成形式:数据仓库和数据集成系统。数据仓库中,GCS 是实例化和物化的;而在数据集成系统中,GCS 仅仅是一个虚拟视图。

1.1 数据集成的重要性与挑战

数据集成的研究历史悠久,但以往的工作大多较为零散,各个项目往往只专注于模式匹配、数据清理或模式映射等某一个方面。当前迫切需要一种半自动化的端到端数据库集成方法,并且要为专家参与提供足够的接口。

1.2 数据交换与数据集成的关系

数据交换是一个相关概念,它被定义为“将源模式下结构化的数据转换为能尽可能准确反映源数据的目标模式实例的问题”。这与我们讨论的数据仓库等物理集成的数据集成方式非常相似,但数据仓库的数据通常属于一个组织,可依据明确定义的模式进行结构化;而在数据交换环境中,数据可能来自不同的源,具有异构性。

1.3 数据库集成的未来趋势

目前,分布式应用中使用的数据越来越多地涉及非数据库数据。研究人员关注的一个新话题是将存储在数据库中的结构化数据与其他系统(如 Web 服务器、多媒体系统、数字图书馆等)中的非结构化数据进行集成。

2. 多数据库系统中的查询处理

多数据库系统中的查询处理比紧密集成和同质的分布式数据库管理系统(DBMS)要复杂得多。除了数据分布的特点外,组成数据库可能是自治的,具有不同的数据库语言和查询处理能力,表现出不同的行为。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值