1 并查集
并查集也叫作不相交集合(Disjoint Set),可以高效实现元素间集合关系的查找与合并。
查找(Find):查找元素所在的集合(这里的集合并不是特指Set这种数据结构,是指广义的数据集合)。
合并(Union):将两个元素所在的集合合并为一个集合。

例如上图中的0、1、2、3属于同一个集合,4、6一个集合,以及7、8、9也组成了一个集合。
1.1 常用优化方法
Size:在union合并两个子集时,通过size(树中元素的数量),让size小的树顶节点的parent指向rank高的树顶点,以此来降低树的高度。
Rank:在union合并两个子集时,通过rank(树高),让rank低的树顶节点的parent指向rank高的树顶点,以此来降低树的高度。
Path Compression(路径压缩):使路径上的所有节点都指向根节点,实现成本稍高,一般不使用。
Path spliting(路径分裂):在执行Find操作时使路径上的每个节点都指向其祖父节点(parent的parent)。
Path halving(路径减半):在执行Find操作时,每隔一个节点,将当前节点的parent指向祖父节点,以此来降低树的高度。
使用路径压缩、分裂(path spliting)或减半(path halving) + 基于rank或者size的优化,可以确保每个操作的均摊时间复杂度为 O 𝛼(𝑛) ,α(𝑛) < 5。
1.2 代码实现
class UnionFind():
def __init__(self,nodes):
self.parents ={}
self.rank = {}
for node in nodes:
self.parents[node]=node
self.rank[node]=1
def is_same(self,v1,v2):
return not v2 if not v1 else self.find(v1).__eq__(self.find(v2))
def union(self,v1,v2):
p1=self.find(v1)
p2=self.find(v2)
r1=self.rank[p1]
r2=self.rank[p2]
if r1<r2:
self.parents[p1]=p2
elif r1>r2:
self.parents[p2]=p1
else:#相等的时候才需要修改rank
self.parents[p1]=p2
self.rank[p2]=r2+1
def find(self, v):#path havling 每隔一个节点指向祖父节点
while not v.__eq__(self.parents[v]):
self.parents[v]=self.parents[self.parents[v]]
v=self.parents[v]
return v
def __str__(self):
result=''
for item in self.parents.keys():
result+=('['+str(item)+' parent:'+str(self.parents.get(item))+' rank:'+str(self.rank.get(item))+']\n')
return result
使用自定义顶点类Vertex进行测试:
class Vertex():#节点
def __init__(self,value):
self.value=value
self.inEdges=set()#入边
self.outEdges=set()#出边
def __hash__(self):
return 0 if not self.value else self.value.__hash__()
def __eq__(self, other):#value相同则认为是同一个,value允许为空
# if other==None:
# return False
return not other.value if not self.value else self.value.__eq__(other.value)
def __str__(self):
return 'None' if self.value==None else '[vertex:'+str(self.value)+']'
if __name__ == '__main__':
verteces={}
for i in range(10):
vertex=Vertex(i)
verteces[i]=vertex
union_find=UnionFind(verteces.values())
union_find.union(Vertex(0),Vertex(1))
union_find.union(Vertex(2),Vertex(3))
union_find.union(Vertex(0),Vertex(2))
print(union_find)
union_find.find(Vertex(0))
print(union_find)
print(union_find.is_same(Vertex(0),Vertex(1)))
print(union_find.is_same(Vertex(0),Vertex(9)))

本文介绍了并查集数据结构,探讨了常用优化技术如Size、Rank、PathCompression、PathSplitting和PathHalving,并提供了Python UnionFind类的实现。通过实例演示了如何查找和合并元素,以及如何利用这些优化手段提升操作效率。
263





