分布式数据规则路径查询处理及访问控制委托框架
在处理分布式数据的规则路径查询时,数据并非集中存储,而是通过广播或单播消息进行访问。本文将介绍基于统计图模型的查询成本估计方法,以及医疗保健领域的访问控制委托框架。
统计图模型与查询成本估计
我们的方法基于数据图的统计模型。首先从样本计算图的模型,然后从该模型重新生成更大的图,在这个合成图上评估查询 q 可以让我们估计在原始数据图 GD 上评估 q 的成本。
统计图模型
- 二项随机图 :基于二项随机图模型(或 Gilbert 模型),对于任意一对节点
(v1, v2),边(v1, v2)存在的概率为p。扩展到有标签的图,对于任何标签a,每条边(v1, a, v2)存在的概率为p(a)。不同边标签的概率p(ai)可以通过频率计数来估计。使用此模型,通过执行 PAA(Path Automaton Algorithm)并将对数据图的访问替换为使用二项分布随机生成边的函数,可以估计查询成本。 - 贝叶斯 - 二项随机图 :上述二项随机图模型的缺点是完全忽略了图的结构,相邻边的存在概率是独立的。而在现实世界的图中,相邻节点的存在和标签可能是相关的。贝叶斯 - 二项随机图模型通过估计边的条件概率来
超级会员免费看
订阅专栏 解锁全文
1185

被折叠的 条评论
为什么被折叠?



