一、定义
并查集(Disjoint set或者Union-find set)是一种树型的数据结构,常用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。在使用中常常以森林来表示。
二、操作
并查集主要有三个操作,分别为:初始化、查找以及合并。
1.初始化:
包括对所有单个的数据建立一个单独的集合(即根据题目的意思自己建立的最多可能有的集合,为下面的合并查找操作提供操作对象)
在每一个单个的集合里面,有三个东西:
1. 集合所代表的数据。
2. 这个集合的层次通常用rank表示(本文代码使用按高度合并,rank表示该节点的高度的负数,故初始化时rank都初始化为-1)。
3. 这个集合的类别parent(即代表元素,代表元素相同代表属于同一个集合,本文使用根节点元素作为代表元素)。
注意:
- 若数据就是这个集合的标号,也就是说只包含2和3,就可以省略1。
- 初始化的时候,一个集合的parent都是这个集合自己的标号。没有跟它同类的集合,那么这个集合的源头只能是自己了。
2.查找:
就是找到输入元素所在集合内的代表元素,用于判断是否与其他元素属于等价关系。
优化:为了方便以后查找,可以使用路径压缩的方式进行优化。
路径压缩:查找时,查找时经过的节点的父节点全部变为根节点,这样方便以后查找。并且由于查找时采用递归,故并未增加额外开销。
3.合并:
将两个树进行合并。最简单的做法是直接让一棵树成为另一颗树的根节点。不过这样构造出来的树并不理想,可能形成一条直线的树。故有按大小合并和按高度合并。
按大小合并是指将较小的树合并到较大的树上(大小指树的大小),使用此种方式在初始化时需要将rank初始化为-1,rank的值为其父节点的位置(非根节点)或该树的大小的负值(根节点);
三、代码
/**
* Created by on 2017/7/19.
* 并查集(不相交集)
*/
public class DisjSets {
class DisjSetsNode {
private String element;//元素
private int rank;//存储秩(最大可能的秩)或者父节点所在位置
}
private DisjSetsNode[] s;//存储并查集每一个元素
/**
* 构造并查集
*
* @param t 并查集的元素
*/
public DisjSets(String[] t) {
s = new DisjSetsNode[t.length];
for (int i = 0; i < t.length; i++) {
s[i] = new DisjSetsNode();
s[i].rank = -1;
s[i].element = t[i];
}
}
/**
* 查找传入元素的代表元素
*
* @param element 需要查找的元素
* @return 返回代表元素 返回为null代表没有该元素
*/
public String find(String element) {
int index = findIndex(element);
if (index == -1) {
return null;
}
return find(index).element;
}
/**
* 合并方法
*
* @param ele1
* @param ele2
*/
public void union(String ele1, String ele2) {
DisjSetsNode root1 = find(findIndex(ele1));//ele1的代表元素(即树的根)
DisjSetsNode root2 = find(findIndex(ele2));//ele2的代表元素(即树的根)
if (root1 == null || root2 == null) {
System.out.println("有元素不存在,并操作失败……");
return;
}
if (root1.element.equals(root2.element)) {
return;
}
if (root1.rank < root2.rank) {//root1的秩大于root2的秩 代表set1高于set2
root2.rank = findIndex(root1.element);
} else if (root1.rank == root2.rank) {//root1的秩与root2的秩相等 秩+1
root1.rank--;
root2.rank = findIndex(root1.element);
} else {//root1的秩小于root2的秩 代表set1低于set2
root1.rank = findIndex(root2.element);
}
}
/**
* 查找方法(使用路径压缩)
*
* @param x 需要查找的下标
* @return
*/
public DisjSetsNode find(int x) {
if (s[x].rank < 0) {
return s[x];
} else {
DisjSetsNode root = find(s[x].rank);
s[x].rank = findIndex(root.element);
return root;
}
}
/**
* 查找该元素的下标
*
* @param element
* @return
*/
private int findIndex(String element) {
for (int i = 0; i < s.length; i++) {
if (s[i].element.equals(element)) {
return i;
} else {
continue;
}
}
return -1;
}
/**
* 测试方法
*
* @param args
*/
public static void main(String[] args) {
String[] is = new String[20];
for (int i = 0; i < is.length; i++) {
is[i] = i + "0";
}
System.out.println("操作前的数组==========");
for (int i = 0; i < is.length; i++) {
System.out.print(is[i] + " ");
}
System.out.println();
DisjSets disjSets = new DisjSets(is);
System.out.println("并查集内的元素=====");
for (int i = 0; i < is.length; i++) {
System.out.print(disjSets.s[i].element + "===" + disjSets.s[i].rank + " ");
}
System.out.println();
System.out.println("并操作之前查找:" + disjSets.find("170"));
disjSets.union("10", "20");
disjSets.union("30", "40");
disjSets.union("10", "30");
disjSets.union("50", "60");
disjSets.union("70", "80");
disjSets.union("50", "80");
disjSets.union("60", "10");
disjSets.union("110", "120");
disjSets.union("130", "140");
disjSets.union("110", "130");
disjSets.union("150", "160");
disjSets.union("170", "180");
disjSets.union("150", "180");
disjSets.union("160", "110");
disjSets.union("10", "110");
System.out.println("并操作之后查找:" + disjSets.find("170"));
System.out.println("并查集内的元素=====");
for (int i = 0; i < is.length; i++) {
System.out.print(disjSets.s[i].element + "===" + disjSets.s[i].rank + " ");
}
System.out.println();
disjSets.find("180");
System.out.println("路径压缩查找之后查找:" + disjSets.find("170"));
System.out.println("并查集内的元素=====");
for (int i = 0; i < is.length; i++) {
System.out.print(disjSets.s[i].element + "===" + disjSets.s[i].rank + " ");
}
System.out.println();
}
}