2、压缩法界定简化树、余图和串并联图的数量-优快云博客

本文链接：https://blog.youkuaiyun.com/flink9streamer/article/details/153810136

压缩法界定简化树、余图和串并联图的数量

1. 引言

树是一种基础模型，广泛应用于搜索键值、建模计算和解析程序等多个领域。由于大型树的显式存储需要大量内存，因此人们期望有一种紧凑的表示方法。例如，字典树结构通过提取单词的前缀来压缩大型单词字典。在数据挖掘领域，也使用其他基本模型来表示具有特定结构的大量数据。

本文聚焦于“无序简化”树，即每个顶点的子节点没有顺序，且没有顶点恰好有一个子节点的树。无序简化树在理论和实践中都具有重要意义。本文提出了一种高效的无序简化树表示方法，该方法用 2ℓ - 2 位来表示具有 ℓ（ℓ ≥ 2）个叶子节点的无序简化树，而传统的有序树表示方法需要 2n - 2 位来表示具有 n 个顶点的有序树，且对于无序简化树有 ℓ ≤ n < 2ℓ。编码和解码都可以在 O(ℓ) 时间内完成，这是首个针对无序简化树的非平凡紧凑表示方法。该表示长度为无序简化树的数量提供了上界，即具有 ℓ 个叶子节点的无序简化树的数量最多为 2^(2ℓ - 2)。

此外，本文还将无序简化树的紧凑表示方法应用于余图和串并联图。余图是一类基本的图，具有简单的递归结构，一些在一般图上难以解决的问题在余图上变得可解。本文估计具有 n 个顶点的余图数量最多为 2^(2n - 1)，这比之前的 2^O(n log n) 上界有了指数级的改进。串并联图也是一类基本的图，在有界树宽图的研究中得到了广泛关注，并且在生物信息学领域有重要应用。本文给出了一种用 ⌈0.528m⌉ 位表示具有 m 条边的串并联图的方法，因此具有 m 条边的串并联图的数量最多为 2^⌈0.528m⌉。余图和串并联图的编码和解码也可以在线性时间内完成。