深入理解CLRS项目中的并查集链表实现-优快云博客

深入理解CLRS项目中的并查集链表实现

CLRS 📚 Solutions to Introduction to Algorithms Third Edition 项目地址: https://gitcode.com/gh_mirrors/clr/CLRS

并查集(Disjoint Set Union, DSU)是计算机科学中一种重要的数据结构，用于维护不相交集合的合并与查询操作。本文将基于CLRS项目中的内容，详细讲解并查集的链表实现方式及其优化策略。

并查集基础概念

并查集支持三种基本操作：

MAKE-SET(x)：创建一个仅包含元素x的新集合
UNION(x, y)：将包含x和y的两个集合合并为一个
FIND-SET(x)：查找x所在集合的代表元素

链表实现详解

基本数据结构设计

在链表表示法中，每个集合维护一个链表，集合中的每个元素都是链表的一个节点：

struct Node {
    int key;        // 元素值
    Set* set;       // 指向所属集合
    Node* next;     // 指向链表中的下一个节点
};

struct Set {
    Node* head;     // 链表头节点
    Node* tail;     // 链表尾节点
    int size;       // 集合大小(元素数量)
};

MAKE-SET操作实现

MAKE-SET(x)
    // 创建一个新集合S
    Set* S = new Set()
    // 初始化x节点的属性
    x.set = S
    x.next = NULL
    // 初始化集合属性
    S.head = x
    S.tail = x
    S.size = 1
    return S

时间复杂度：O(1)，仅需常数时间完成初始化。

FIND-SET操作实现

FIND-SET(x)
    return x.set.head

时间复杂度：O(1)，直接返回集合的头指针。

UNION操作与加权合并启发式

朴素UNION操作直接将一个链表附加到另一个链表末尾，时间复杂度为O(n)。通过加权合并启发式(Weighted-Union Heuristic)，我们总是将较小的集合合并到较大的集合中：

UNION(x, y)
    S1 = x.set
    S2 = y.set
    if S1.size >= S2.size
        // 将S2合并到S1中
        S1.tail.next = S2.head
        // 更新S2中所有元素的集合指针
        Node* z = S2.head
        while z != NULL
            z.set = S1
            z = z.next
        // 更新集合属性
        S1.tail = S2.tail
        S1.size += S2.size
        return S1
    else
        // 对称操作，将S1合并到S2中
        ...

加权合并启发式的关键点：