概率链接查询处理技术详解
1. 精确查询回答算法
在处理概率链接数据时,精确查询回答算法是关键。我们可以基于子图概率计算技术来回答概率阈值前 k 查询。
1.1 精确算法步骤
- 构建图与排序 :构建对应的 PME - 图 G,并根据评分函数 f 对满足查询谓词 P 的所有顶点进行排序,得到排序后的顶点列表 S = {v1,···,vn}。
- 扫描顶点 :逐个扫描顶点,对于每个顶点 vi,导出其主导子图 G(vi),使用相关方法计算 G(vi) 的子图概率,再通过特定公式计算 vi 的前 k 概率。
1.2 中间结果复用
为了降低计算成本,我们可以复用中间结果。当计算完一个顶点的子图概率后,可利用这些结果计算排名列表中下一个顶点的子图概率。以下是不同情况的分析:
|情况|描述|示例|处理方式|
|----|----|----|----|
|情况 1|vi 和 vi + 1 都不在 Gj 中|图 7.7 中的 G1|Gj(vi + 1) = Gj(vi)|
|情况 2|只有 vi 在 Gj 中|图 7.7 中的 G3|根据推论 7.3,Gj(vi) 是 Gj(vi + 1) 的子图,基于 Pr(Gj(vi),x|vi) 使用公式 7.7 计算 Pr(Gj(vi + 1),x)|
|情况 3|只有 vi + 1 在 Gj 中|图 7.7 中的 G2|根据推论 7.3,Gj(vi) 是 Gj(vi + 1) 的子图,基于 Pr(Gj(vi),x) 使用定理 7.4 计算