不确定流上的连续排名查询技术解析
在处理不确定流数据时,连续排名查询是一个关键问题。本文将详细介绍几种用于解决不确定流上连续排名查询的方法,包括精确算法、采样方法以及空间高效方法。
1. 相关概念基础
- 兼容优势集(Compatible dominant set) :以滑动窗口 $W_t^3$ 和 $W_{t + 1}^3$ 为例,在时间 $t + 1$ 时,部分实例(如 $a_1,b_1,c_1,d_1$)过期,新实例(如 $a_4,b_4,c_4,d_4$)到达。在扫描扩展排序列表时,除了 $d_3$ 外,$W_{t + 1}^3$ 中的每个实例都能找到兼容优势集,仅需对 $d_3$ 进行泊松递归计算。
- 最高可能排名(Highest possible rank) :对于滑动窗口 $W_t$ 中的实例 $o$,随着窗口滑动,新实例到来,旧实例过期,$o$ 的排名可能上升或下降。但比 $o$ 晚到达或同时到达的实例不会在 $o$ 之前过期,所以 $o$ 在未来滑动窗口中的可能排名受“不比 $o$ 老”的实例限制。
- 引理 6.2 :对于在时间 $i$ 到达的实例 $O[i]$,在滑动窗口 $W_t^{\omega}(O)$ 中($t - \omega + 1 < i \leq t$),设 $R_{O[i]} = {O’[j]|O’ \in O, O’ \neq O, j \geq i}$,在任何 $t’ > t$ 的滑动窗口 $W_{t’}^{\omega}$ 中,$O[i]$ 的排名不小于 $|R_{O[i]
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



