使用本体集成和交换 XML 数据
1 引言
1.1 问题描述
数据集成旨在将不同来源的数据整合起来,为用户提供统一的数据视图,在数据仓库、企业信息集成、地理信息系统和电子商务等众多领域都有重要应用。中央数据集成系统通常基于全局模式构建,其关键问题包括系统建模和查询处理。
在系统建模方面,有两种基本方法来处理数据源与全局模式的关系:
- 全局视图法(GaV) :将全局模式用数据源来表示。
- 局部视图法(LaV) :全局模式独立于数据源指定,每个数据源被定义为全局模式上的视图。
查询处理可能需要对查询进行重新表述。在 GaV 方法中,全局模式中的每个实体都与源局部模式上的视图相关联,查询处理采用简单的“展开”策略;而 LaV 方法的查询处理可能较为复杂,因为局部数据源可能包含不完整的信息,类似于处理不完整信息的查询回答。此外,数据来源之间可能存在语法、模式和语义上的异构性,这些异构性必须被解决,才能实现数据的集成和互操作。
XML 虽然提供了统一的语法和半结构化数据模型,但它只表达结构,不表达语义。概念上等价的 XML 模式在结构上可能存在差异,这使得用户在查询不同 XML 源时需要根据不同的结构构建查询,增加了查询的难度,也阻碍了 XML 源之间的互操作。
例如,有两个 XML 模式 S1 和 S2,它们都表示书籍和作者之间的多对多关系,但结构不同。S1 以书籍为中心,作者元素嵌套在书籍元素下;S2 以作者为中心,文章元素嵌套在作者元素下。若要查询“找到出版物 b2 的所有作者”,在两个模式树中定义搜索模式的 XML 路径
超级会员免费看
订阅专栏 解锁全文
37

被折叠的 条评论
为什么被折叠?



