计数最小草图中的相变与最小链接 C 定向路径问题解析
计数最小草图中的相变
在计数最小草图(Count - Min Sketch)中,误差情况会因不同的分布和状态而有所不同。在亚临界状态下,均匀分布呈现出最小的误差。然而,在超临界状态下,当不同键的数量相较于计数器的数量较大时,情况则相反,均匀分布呈现出最大的平均误差。
对于齐普夫分布(Zipf’s distribution),高频键基本上没有误差,而在超临界状态下,低频键都有相似的高估。这揭示了齐普夫分布在误差近似方面的另一种相变,发生在高频和低频元素之间,这对于准确检测流中的重击者(heavy hitters)有直接的应用。
最小链接 C 定向路径问题
问题描述
给定一个平面上的 C 定向不相交线段集合 $E = {e_1, \ldots, e_n}$,其中 C 是一个给定的有限方向集合,它能覆盖整个平面,同时给定两个点 $s$ 和 $t$。我们的目标是找到一个从 $s$ 到 $t$ 的最小链接 C 定向路径 $\pi$,该路径按顺序访问集合 $E$ 中的线段,并且其边的方向都在 C 中,边的数量最少。
更正式地说,C 是一个有限的方向集合,可以看作是以原点为中心的单位圆上的点。我们假设:
1. C 能覆盖平面,即对于平面上的任意两点 $p$ 和 $q$,存在一个两链接(有向)路径(或单链接路径)从 $p$ 到 $q$,且路径中边的方向都属于 C。
2. 对于任意方向 $c_i \in C$,其相反方向 $\overline{c_i}$ 也在 C 中。
路径要求为 C 定向的,这在某些情况下(如机械约束)是必要的,并且与
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



