并查集 union-find 是一种数据结构,主要是解决动态连通性问题,最核心的两个操作是find()和union(),分别是查找元素属于哪个集合以及将两个集合进行合并,速度非常快。
常常用于解决传递性问题。
底层数据结构是【数组】或者【哈希表】,数组下标和哈希表的key是本身这个节点,数组的值或者value是这个节点的父亲节点。
动态连通性是指 先查询两个节点是否位于不同集合中,如果位于不同集合,就加入一套边,就是边查询边连同,称为动态连通性。
我是参考算法4中内容进行学习的,讲的非常好
需要强调的是:并查集只回答连通性问题,并不回答属于一个连同分量中的顶点是如何连起来的。
一般使用的最优化算法都是带路径压缩的并查集,最核心的就是find()函数的实现,将所有的节点都直接链接到它的根节点上,我们在检查节点的同时将她们直接链接到根节点上即可,这样得到的就是近乎扁平化的树,路径压缩的加权quick-union算法是最优的算法,但并非所有操作都能在常数时间内完成。
路径压缩代码如下:使用了递归的写法,非常精妙,能够在回溯的过程中把所有遍历过的节点直接链接到根节点,实现一个扁平化的树结构。
public int find(int p){
if(p != id[p]){
id[p] = find(id[p]);
}
return id[p];
}
普通的加权union-find算法,在合并集合(树)的过程中就是把较小的树合并到较大的树上面去。
代码如下:
public class WeightedQuickUnionUF{
private int[] id;//父链接数组(由触点索引,就是由下标索引)
private int[] sz;//由触点索引的 各个根节点所对应的分量的大小,就是含有结点的个数
private int count;
public WeightedQuickUnionUF(int N){
count = N;
id = new int[N];
for(int i = 0;i < N;i++){
id[i] = i;
}
sz = new int[N];
for(int i = 0;i < N;i++){
sz[i] = 1;
}
}
public int count(){
return count;
}
//判断两个节点是否属于一个集合
public boolean connected(int p ,int q){
return find(p) == find(q);
}
public int find(int p){
//跟随链接找到根节点,根节点的特点就是 p = id[p]
while(p != id[p]){
p = id[p];
}
return p;
}
public void union(int p,int q){
int i = find(p);
int j = find(q);
if(i == j) return;
// 将小树的根节点链接到大树的根节点
if(sz[i] < sz[j]){
id[i] = j;
sz[j] += sz[i];
}else{
id[j] = i;
sz[i] += sz[j];
}
count--;//分量减一
}
}
}