在线查询回答技术详解
在处理不确定数据时,查询回答是一个关键的环节。本文将详细介绍几种常见的查询类型的回答方法,包括 PT - k 查询、Top - (k, l) 查询、Top - (p, l) 查询,以及一种优化的数据结构 PRist+及其快速构建算法。
1. 回答 PT - k 查询
PT - k 查询是指找到那些在排名前 k 中出现的概率大于给定阈值 p 的元组。下面通过一个例子来说明如何评估 PT - k 查询。
示例 :考虑不确定元组,对于一个 PT - k 查询,其中 k = 3,p = 0.45。我们只需查看包含 p = 0.45 的概率区间 b3 = (0.4, 0.6]。在 b3 的 U - 列表中,t3.U3 = 3 且 t4.U3 = 3,这意味着 Pr3(t3) > 0.6 且 Pr3(t4) > 0.6,所以 t3 和 t4 可以直接加入答案集,无需计算其精确的前 k 概率。在 b3 的 L - 列表中,t2.L3 = 4,即 Pr4(t2) ≤ 0.4,所以 t2 可以被剪枝。最后,只需计算 t1 的前 3 概率,由于 Pr3(t1) = 0.5,t1 也可加入答案集,最终答案为 {t1, t3, t4}。
PT - k 查询评估分为三个步骤:
1. 边界确定 :使用推论 5.4 来确定元组 t 的前 k 概率是否在概率区间 bi 内。
- 推论 5.4 :设 T 是由 PRist 索引的不确定元组集合,粒度参数为 h。对于元组 t ∈ T 和正整数 k,如果 bi (1 ≤ i ≤ h)
超级会员免费看
订阅专栏 解锁全文
7054

被折叠的 条评论
为什么被折叠?



