基于rank、path halving实现并查集（python)

最新推荐文章于 2025-02-27 06:09:40 发布

原创最新推荐文章于 2025-02-27 06:09:40 发布 · 556 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #数据结构 #算法 #二叉树

Python 同时被 2 个专栏收录

43 篇文章

订阅专栏

数据结构与算法

38 篇文章

订阅专栏

本文介绍了并查集数据结构，探讨了常用优化技术如Size、Rank、PathCompression、PathSplitting和PathHalving，并提供了Python UnionFind类的实现。通过实例演示了如何查找和合并元素，以及如何利用这些优化手段提升操作效率。

1 并查集

并查集也叫作不相交集合（Disjoint Set）,可以高效实现元素间集合关系的查找与合并。
查找（Find）：查找元素所在的集合（这里的集合并不是特指Set这种数据结构，是指广义的数据集合）。
合并（Union）：将两个元素所在的集合合并为一个集合。

在这里插入图片描述
例如上图中的0、1、2、3属于同一个集合，4、6一个集合，以及7、8、9也组成了一个集合。

1.1 常用优化方法

Size:在union合并两个子集时，通过size（树中元素的数量），让size小的树顶节点的parent指向rank高的树顶点，以此来降低树的高度。

Rank:在union合并两个子集时，通过rank（树高），让rank低的树顶节点的parent指向rank高的树顶点，以此来降低树的高度。

Path Compression(路径压缩)：使路径上的所有节点都指向根节点，实现成本稍高，一般不使用。

Path spliting(路径分裂)：在执行Find操作时使路径上的每个节点都指向其祖父节点（parent的parent)。

Path halving（路径减半）:在执行Find操作时，每隔一个节点，将当前节点的parent指向祖父节点，以此来降低树的高度。

使用路径压缩、分裂(path spliting)或减半(path halving) + 基于rank或者size的优化，可以确保每个操作的均摊时间复杂度为 O 𝛼(𝑛) ，α(𝑛) < 5。

1.2 代码实现

class UnionFind():
    def __init__(self,nodes):
        self.parents ={}
        self.rank = {}
        for node in nodes:
            self.parents[node]=node
            self.rank[node]=1

    def is_same(self,v1,v2):
        return not v2 if not v1 else self.find(v1).__eq__(self.find(v2))

    def union(self,v1,v2):
        p1=self.find(v1)
        p2=self.find(v2)
        r1=self.rank[p1]
        r2=self.rank[p2]
        if r1<r2:
            self.parents[p1]=p2
        elif r1>r2:
            self.parents[p2]=p1
        else:#相等的时候才需要修改rank
            self.parents[p1]=p2
            self.rank[p2]=r2+1

    def find(self, v):#path havling 每隔一个节点指向祖父节点
        while not v.__eq__(self.parents[v]):
            self.parents[v]=self.parents[self.parents[v]]
            v=self.parents[v]
        return v

    def __str__(self):
        result=''
        for item in self.parents.keys():
            result+=('['+str(item)+' parent:'+str(self.parents.get(item))+' rank:'+str(self.rank.get(item))+']\n')
        return result

使用自定义顶点类Vertex进行测试:

class Vertex():#节点
    def __init__(self,value):
        self.value=value
        self.inEdges=set()#入边
        self.outEdges=set()#出边

    def __hash__(self):
        return 0 if not self.value else self.value.__hash__()

    def __eq__(self, other):#value相同则认为是同一个,value允许为空
        # if other==None:
        #     return False
        return not other.value if not self.value else self.value.__eq__(other.value)

    def __str__(self):
        return 'None' if self.value==None else '[vertex:'+str(self.value)+']'

if __name__ == '__main__':
    verteces={}
    for i in range(10):
        vertex=Vertex(i)
        verteces[i]=vertex
    union_find=UnionFind(verteces.values())
    union_find.union(Vertex(0),Vertex(1))
    union_find.union(Vertex(2),Vertex(3))
    union_find.union(Vertex(0),Vertex(2))
    print(union_find)
    union_find.find(Vertex(0))
    print(union_find)
    print(union_find.is_same(Vertex(0),Vertex(1)))
    print(union_find.is_same(Vertex(0),Vertex(9)))