基于成本驱动的本体数据访问
1. 引言
在本体数据访问(OBDA)中,SPARQL 查询应答是通过将其转换为对数据源的 SQL 查询来实现的。目前的标准转换技术试图将用户查询转换为联合查询(UCQ),因为现代关系数据库引擎能够高效地评估 UCQ。然而,这种转换并非总是最佳选择。在本体、映射和数据统计信息相互作用的特定条件下,替代转换方式可能会更高效。
传统 UCQ 转换存在一些问题:
- 查询规模膨胀 :生成 UCQ 可能导致用户查询规模呈指数级增长。
- 数据冗余 :UCQ 结构会加剧冗余数据问题,每个 CQ 都试图丰富检索答案集,但不一定能检索到新结果。
前人的研究中,Bursztyn 等人考虑了 UCQ 连接(JUCQ)作为 UCQ 重写的替代方案,并设计了基于成本的算法来选择最佳方案。但他们的工作范围有限,未考虑映射,且使用传统数据库成本模型。
本文研究了在考虑映射的一般 OBDA 环境下的替代转换问题。我们首先研究如何将 JUCQ 重写转换为 SQL 查询,同时保持 JUCQ 结构和对数据库值进行连接的能力。此外,我们还设计了基于新颖基数估计的成本模型,以评估 UCQ 或 JUCQ 转换在数据库上的评估成本。
2. 预备知识
- OBDA 规范 :采用 OBDA 框架,通过 OBDA 规范 S = (T, M, Σ) 进行形式化,其中 T 是本体 TBox,M 是映射集,Σ 是关系数据库模式。
- 本体语言
超级会员免费看
订阅专栏 解锁全文
1041

被折叠的 条评论
为什么被折叠?



