压缩法界定简化树、余图和串并联图的数量
1. 引言
树是一种基础模型,广泛应用于搜索键值、建模计算和解析程序等多个领域。由于大型树的显式存储需要大量内存,因此人们期望有一种紧凑的表示方法。例如,字典树结构通过提取单词的前缀来压缩大型单词字典。在数据挖掘领域,也使用其他基本模型来表示具有特定结构的大量数据。
本文聚焦于“无序简化”树,即每个顶点的子节点没有顺序,且没有顶点恰好有一个子节点的树。无序简化树在理论和实践中都具有重要意义。本文提出了一种高效的无序简化树表示方法,该方法用 2ℓ - 2 位来表示具有 ℓ(ℓ ≥ 2)个叶子节点的无序简化树,而传统的有序树表示方法需要 2n - 2 位来表示具有 n 个顶点的有序树,且对于无序简化树有 ℓ ≤ n < 2ℓ。编码和解码都可以在 O(ℓ) 时间内完成,这是首个针对无序简化树的非平凡紧凑表示方法。该表示长度为无序简化树的数量提供了上界,即具有 ℓ 个叶子节点的无序简化树的数量最多为 2^(2ℓ - 2)。
此外,本文还将无序简化树的紧凑表示方法应用于余图和串并联图。余图是一类基本的图,具有简单的递归结构,一些在一般图上难以解决的问题在余图上变得可解。本文估计具有 n 个顶点的余图数量最多为 2^(2n - 1),这比之前的 2^O(n log n) 上界有了指数级的改进。串并联图也是一类基本的图,在有界树宽图的研究中得到了广泛关注,并且在生物信息学领域有重要应用。本文给出了一种用 ⌈0.528m⌉ 位表示具有 m 条边的串并联图的方法,因此具有 m 条边的串并联图的数量最多为 2^⌈0.528m⌉。余图和串并联图的编码和解码也可以在线性时间内完成。
2. 预备知识
- <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



