基于本体的 XML 数据集成与查询处理
1. 框架概述
框架具备两个核心功能:
- 对所有 XML 源进行查询的制定。
- 作为通过任意 XML 源访问分布式数据的中介机制。
2. 查询处理
框架采用查询重写策略来处理用户查询,查询处理有以下两个方向:
- 全局到局部查询重写 :当用户在全局本体上提出查询 q 时,系统将 q 重写为子查询的并集 q′,每个子查询对应一个 XML 源。然后在 XML 源上执行这些子查询以获取答案,最后将这些答案合并(使用并集操作)得到 q 的答案。
- 局部到局部查询重写 :当在局部源上提出查询 q 时,其答案不仅包括从该局部源检索到的结果,还包括系统中所有其他源的结果。为了从其他源获取答案,需要通过全局本体将 q 重写为查询的并集 q′,每个查询对应一个其他源。此方向的查询重写与对等系统中的重写类似。
查询重写基于映射表中的映射信息,映射表中的每个条目包含全局本体的一个元素(RDF 类或属性)及其在本地源模式中的对应元素。同时,需要考虑用于制定查询的查询语言,因为它们可能具有不同的表达能力。这里考虑用于 XML 源查询的联合 XQuery(c - XQuery)和用于全局 RDFS 本体查询的联合 RDQL(c - RDQL)。
3. 结构与语义集成
3.1 本地 XML 模式与本地 RDFS 本体
为了集成异构 XML 数据源,首先将本地 XML 模式转换为本地 RDFS 本体,同时保留 XML 文档结构。这里主要关注嵌套结构(即层次结构)
超级会员免费看
订阅专栏 解锁全文
37

被折叠的 条评论
为什么被折叠?



