目录
- 并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题
- 并查集通常用森林来表示,森林中的每棵树表示一个集合,树中的结点对应一个元素
说明: 虽然利用其他数据结构也能完成不相交集合的合并及查询,但在数据量极大的情况下,其耗费的时间和空间极大
一、并查集的原理
以朋友圈为例,现在有10个人(从0开始编号),刚开始这10个人互不认识,各自属于一个集合
并查集会用一个数组来表示这10个人之间的关系,数组的下标对应就是这10个人的编号,刚开始时数组中的元素都初始化为-1
说明:数组中某个位置的值为负数,表示该位置是树的根,这个负数的绝对值表示的这棵树(集合)中数据的个数,因为刚开始每个人各自属于一个集合,所以将数组中的位置都初始化为-1
后来这10个人之间通过相互认识,最终形成了三个朋友圈
此时并查集数组中各个位置的值如下
说明:数组中某个位置的值为非负数,表示该位置不是树的根,这个非负数的值就是这个结点的父结点的编号
后来4号和8号又通过某种机遇互相认识了,这时其所在的两个集合就需进行合并,最终就变成了两个朋友圈
在根据两个元素合并两个集合时,需先分别找到这两个元素所在集合的根结点,然后再将一个集合合并到另一个集合,并且合并后需要更新数组中根结点的值
合并集合找根结点的原因:
- 若这两个元素所在集合的根结点相同,说明这两个元素本身就在同一个集合,无需合并
- 合并集合后需要更新这两个集合的根结点的值
二、并查集的实现
实现并查集时通常会实现如下接口:
- 初始化并查集
- 查找元素所在的集合
- 判断两个元素是否在同一个集合
- 合并两个元素所在的集合
- 获取并查集中集合的个数
#include <iostream>
#include <vector>
using namespace std;
class UnionFindSet
{
public:
// 构造函数
UnionFindSet(size_t size);
// 查找元素所在的集合
int FindRoot(int value);
// 判断两个元素是否在同一个集合
bool IsSameSet(int value1, int value2);
// 合并两个元素所在的集合
bool Union(int value1, int value2);
// 获取并查集中集合的个数
size_t GetSetSize();
private:
vector<int> _ufs; //维护各个结点间的关系
};
并查集中的数组:
- 数组的下标依次对应每个元素的编号
- 数组中元素值为负数,表示下标编号元素为根结点,负数的绝对值表示该集合中元素的个数
- 数组中元素值为非负数,表示下标编号元素的父结点的编号
2.1 并查集的初始化
并查集中会用一个数组来维护各个结点之间的关系,在初始化并查集时,根据元素的个数开辟数组空间,并将数组中的元素初始化为-1即可