XML 树枝模式查询处理中的语义应用
1. XML 树枝模式查询基础
在 XML 数据处理中,树枝模式查询是常见的操作。通过将查询模式 Q 与文档树 T 进行匹配,依据对应文档节点间的关系,匹配操作会返回一个 n 元组列表来回答查询 Q,其中 n 为 Q 中的节点数量,每个元组 $(a_1, a_2, …, a_n)$ 由文档节点 $a_1, a_2, …, a_n$ 组成,这些节点标识了 Q 在 T 中的一个不同匹配。
2. 文档标记与倒排列表
在树枝模式查询处理中,检查两个文档节点是否满足树枝模式查询中指定的父子(PC)或祖先 - 后代(AD)关系至关重要。为便于进行这种关系检查,通常会为每个文档节点分配一个位置标记(简称标记)。
常见的 XML 数据标记方案有多种,其中包含方案和前缀方案最为流行,还有一些动态编码方案可避免对动态文档进行重新标记。这里以包含标记方案为例,只要能用于确定 PC 和 AD 关系,也可替换为其他方案。
标记通常通过倒排列表进行组织。一般来说,对于每种类型的文档节点,都有一个对应的倒排列表,按文档顺序存储该类型所有节点的标记。处理查询时,仅扫描相关的倒排列表,基于查询约束执行结构连接。由于多数算法以流式方式扫描倒排列表,所以它也被称为标记流,在某些工作中简称为流。
3. XML 数据中对象、属性和值的语义
- 基本概念 :在数据管理中,对象(或实体)是重要的信息单元。在以数据为中心的 XML 数据库中,对象同样重要,因为大多数 XML 查询都围绕对象信息展开。对象通常具有多个属性,从不同方面描述该对象,这里使用“属性
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



