并查集和集合

最新推荐文章于 2025-10-31 23:20:11 发布

原创

最新推荐文章于 2025-10-31 23:20:11 发布 · 340 阅读

CC 4.0 BY-SA版权

文章标签：

引入

在修建道路时，为了让尽可能多的点连通，需要修建连通两个点的公路，这就需要随时询问两个点是否已经连通。

若将已经连通的点看作一个集合，那么修建一条公路的意义，就是合并两个集合，所以如何快速查询两个点是否属于同一个集合，以及快速地合并两个集合，十分重要。

集合是由一个或多个确定的元素所构成的整体。集合中的元素有如下三个特征:

并查集是一个可以维护集合的数据结构，它能高效支持集合的基本操作:

需要注意的是，由于计算机存储结构的限制，并查集维护的集合是离散意义下的集合，而不是广义的集合。集合中的元素是有限的。

数组存储
存储一个集合最简单的方式就是直接用数组。我们将一个集合的所有元素按某种特定顺序存储在数组里。使用数组存储集合，可以支持较丰富的集合操作，但是维护集合的时间复杂度较高，对于几乎所有操作，单次操作的时间复杂度都是和集合大小成正比的。

在C++语言中，我们可以使用STL中的vector来实现数组存储集合。
链表存储
可以模仿数组存储方式，将集合中的元素存储在一个链表里。链表一大好处是可以避免元素的复制，这对于合并操作是比较有帮助的，在定位元素所在的集合的两端后，直接将两个集合的端点相接即可合并完成。

然而，使用链表维护集合的最坏情况时间复杂度仍然是与集合大小成正比的，在时间效率上还不够优秀。

在 C++ 语言中，我们可以使用 STL 中的 list 来实现链表存储集合。如果题目对时间效率的要求较高，也可以选择自行实现链表。

值得一提的是，假设元素总数是 nn，且仅需要支持合并和查询操作，那么上述两种方式可以采用启发式合并的技术(即每次将较小集合合并入较大集合并修改较小集合所有元素的信息)做到总时间复杂度 O(n\log_2 n)O(nlog2n)。虽然单次操作的时间复杂度较高，但是可以证明总时间复杂度是可以接受的。
森林存储
这就是并查集。