并查集原理
概念
在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-findset)。
示例
比如大学刚开学,一个班有10个新同学,起初他们互相不认识。
假设10个同学编号1-10。
用数组的编号代表这些同学,同时数组内初始全为-1(置为-1的原理后边解释)。

然后经过一些时间,他们三四成堆,有了自己的小圈子。
假设{0,6,7,8},{1,4,9},{2,3,5};这些同学形成了自己的圈子,下边我们把圈子看作一个小队,同时假设三个圈子0,1,2担任队长。

这每一个树,就算是一个朋友圈(小队)。

从上图可以看出:编号6,7,8同学属于0号小分队,该小分队中有4人(包含队长0);编号为4和9的同学属于1号小分队,该小分队有3人(包含队长1),编号为3和5的同学属于2号小分队,该小分队有3个人(包含队长1)。
同时我们得到以下结论:
- 数组的下标对应集合中元素的编号
- 数组中如果为负数,负号代表根,数字代表该集合中元素个数
- 数组中如果为非负数,代表该元素双亲在数组中的下标
然后又经过一段时间,0号小分队中8号同学与1号小分队1号同学奇走到了一起,两个小圈子的学生又相互介绍,最后成为了一个大的小圈子。如下图:

经过如此变化,数组内容变成了如下:

并查集实现
class UnionFindSet
{
public:
// 初始时,将数组中元素全部设置为1
UnionFindSet(size_t size)
: _ufs(size, -1)
{}
// 给一个元素的编号,找到该元素所在集合的名称
int FindRoot(int index)
{
// 如果数组中存储的是负数,找到,否则一直继续
while(_ufs[index] >= 0)
{
index = _ufs[index];
}
return index;
}
//将x2合并到x1集合下
bool Union(int x1, int x2)
{
int root1 = FindRoot(x1);
int root2 = FindRoot(x2);
// x1已经与x2在同一个集合
if(root1 == root2)
return false;
// 将两个集合中元素合并
_ufs[root1] += _ufs[root2];
// 将其中一个集合名称改变成另外一个
_ufs[root2] = root1;
return true;
}
// 数组中负数的个数,即为集合的个数
size_t Count()const
{
size_t count = 0;
for(auto e : _ufs)
{
if(e < 0)
++count;
}
return count;
}
private:
vector<int> _ufs;
};
并查集应用
通过以上介绍,总结并查集一般可以解决一下问题 :
- 查找元素属于哪个集合
沿着数组表示树形关系以上一直找到根(即:树中中元素为负数的位置) - 查看两个元素是否属于同一个集合
沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在 - 将两个集合归并成一个集合
(1)将两个集合中的元素合并
(2)将一个集合名称改成另一个集合的名称 - 集合的个数
遍历数组,数组中元素为负数的个数即为集合的个数。

并查集是一种用于处理集合合并与查询的数据结构。在大学班级场景中,它用于模拟学生形成不同群体的过程。通过数组表示集合关系,负数表示根节点及集合大小,非负数表示父节点。并查集能解决查找元素所属集合、判断元素间关系及合并集合等问题。
3295

被折叠的 条评论
为什么被折叠?



