亚瑟 - 梅林流式复杂性研究
1 引言
数据流式计算模型是一种常用于处理网络流量的算法抽象,它能让算法以亚线性空间运行。在这个模型中,算法接收一系列元素(通常为整数)作为输入,这些元素构成数据流,记为 σ = (a1, …, am),其中 a1 是第一个元素,a2 是第二个元素,依此类推。算法逐个接收元素,且在看到每个 ai 后,就无法再访问索引小于 i 的元素。该算法的目标是尽可能少地使用空间来计算数据流的函数。
数据流模型中最基本的问题之一是不同元素问题,即计算给定数据流中不同元素的数量。这个问题在过去二十年中得到了广泛研究,其重要性不仅源于广泛的应用场景,如 IP 路由、数据库操作和文本压缩,还在于它能为数据流模型中的计算本质提供理论见解。
Alon 等人证明了在足够长的数据流(长度至少与字母表大小 n 成正比)中,精确计算不同元素数量的流式复杂度存在 Ω(n) 的下界。为了降低不同元素问题的空间复杂度,人们开展了一系列关于近似算法的研究。Kane 等人给出了第一个用于估计数据流中不同元素数量的最优近似算法,对于字母表大小为 n 的数据流,给定 ϵ > 0,该算法使用 O(ϵ - 2 + log n) 位空间,以 2/3 的成功概率计算 (1 ± ϵ) 的乘法近似值。
为了在不采用近似方法的情况下降低流式算法的空间复杂度,一种自然的方法是考虑概率证明系统。Chakrabarti 等人展示了使用类似于 MA 的概率证明系统的带注释数据流算法。后续的研究也继续使用概率证明系统来降低众多图问题的流式复杂度。
本文研究了亚瑟 - 梅林概率证明系统在数据流模型中的能力,展示了一种适用于广泛数据流问题的规范 AM 流式算法,该算法在证明长度
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



