对等数据库系统中的数据交换问题探讨
1. 引言
对等(P2P)范式催生了完全分布式、协作式的网络设计。在这种设计里,节点无需监管就能共同构成一个系统。与数据集成架构不同,P2P数据共享系统不依赖中介模式来实现数据共享。在P2P系统中,每个对等节点都是自主数据源,拥有本地模式,并仅向其他节点披露部分模式信息。数据管理和协调完全去中心化,节点在建立连接时会半自动创建中介映射。
在大规模非结构化P2P数据管理系统中,新加入的节点往往随机选择连接节点,这导致它们不仅要向邻居节点发送查询,还需向系统的更多部分发送查询。由于缺乏全局模式,节点只能基于本地模式表达和回答查询,且无法精准地将查询导向合适的远程节点。
查询处理通常是在覆盖网络中按有限深度路径传播查询,并在每个路由步骤根据映射重写查询。然而,多次重写会导致查询信息丢失,降低查询回答的准确性和性能。
1.1 示例说明
假设有一个P2P系统,包含私人医生、诊断实验室和医院的数据库。以Dr Davis的数据库为例,他想查询患者疾病信息,原始查询如下:
Qorig:
SELECT V.Pid, D.DisDescr, D.Ache,
T.Drug, T.Dosology
FROM Disease D, Treatment T, Visits V
WHERE V.Did = D.Did AND D.Did = T.Did
该查询在传播过程中不断重写,每次重写都会丢失部分属性信息,限制条件也可能增加。例如,在StuartDB上重写后的查询丢失了药物剂量信息:
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



