不确定数据的概率路径查询与排名查询研究
1. 概率路径查询中的层次索引
在概率路径查询中,为了高效地回答查询,引入了层次分区树来索引图的顶点并维护权重概率分布信息。
- HP - Tree 索引
- 图分区 :图分区将图的顶点划分为大小大致相等的子集,使得子集之间的边较少。例如,在一个图中进行 2 - 分区,所有顶点被分为两个子集,由线 l1 分隔。l1 左侧只有 A 和 B 与右侧子集的顶点相连,A 和 B 就是边界顶点;同理,右侧子集的 C、D 和 E 是边界顶点。
- 递归分区 :2 - 分区可以递归地应用于每个子集。如左侧子集可由线 l2 进一步划分为两个更小的子集,右侧子集由 l3 划分。通过递归分区可得到图的层次分区树。
- HP - Tree 构建 :给定图 G 和 m - 分区 P,层次分区树(HP - tree)是一个 m 叉树,根据 P 对 G 中的顶点进行索引。HP - tree 的每个叶节点代表一个顶点,非叶节点代表一组顶点。构建时从根节点开始,根节点代表图 G 的所有顶点集合,然后递归地对图进行分区。对于非叶节点 N 及其关联的顶点集 VN,对 VN 进行 m - 分区,得到 m 个互斥子集 VN1, …, VNm,为 N 构建 m 个对应的子节点,分区持续到每个子集最多包含 d 个顶点(d 是用户指定的数字)。若使用线性时间启发式图分区方法,构建 HP - tree 需要 O(nlogm(n/d)) 时间。
graph