堆排序详解:从原理到实现

1. 堆的基本概念

什么是堆?

堆是一种特殊的完全二叉树,它满足以下性质:

  • 对于大顶堆:每个节点的值都大于或等于其左右子节点的值

  • 对于小顶堆:每个节点的值都小于或等于其左右子节点的值

堆的分类

堆主要分为两种类型:

  • 大顶堆:根节点是所有节点中的最大值,适用于升序排序

  • 小顶堆:根节点是所有节点中的最小值,适用于降序排序

为什么要建堆?

建堆的目的是为了快速获取数据集中的最大值或最小值。堆结构可以在O(1)时间内获取极值,并在O(log n)时间内维护堆的性质,这使得堆在排序和优先级队列等场景中非常高效。

建堆的用途

  1. 堆排序:高效的排序算法,时间复杂度为O(n log n)

  2. 优先级队列:快速获取和删除最高/最低优先级的元素

  3. 解决Top-K问题:快速找出前K个最大或最小的元素

  4. 图算法:如Dijkstra算法中使用堆优化

2. 向上调整算法

算法思路

向上调整算法用于在堆中插入新元素时维护堆的性质。当向堆末尾插入新元素后,需要将该元素与其父节点比较,如果违反堆性质则交换,重复此过程直到满足堆性质或到达根节点。

算法实现

//向上调整算法
void AdjustUp(HPDataType* a, int child) {
    assert(a);
    int parent = (child - 1) / 2;
    while (child > 0) {
        if (a[child] > a[parent]) {   // >建立大根堆,<建立小根堆
            Swap(&a[child], &a[parent]);
            child = parent;
            parent = (child - 1) / 2;
        }
        else {
            break;
        }
    }
}

时间复杂度

向上调整算法的时间复杂度为O(log n),因为最坏情况下需要从叶子节点调整到根节点,而完全二叉树的高度为log₂n。

3. 向下调整算法

算法思路

向下调整算法用于删除堆顶元素后维护堆的性质。当删除堆顶元素后,将最后一个元素移到堆顶,然后将该元素与其较大的子节点比较,如果违反堆性质则交换,重复此过程直到满足堆性质或到达叶子节点。

算法实现

//向下调整算法
void AdjustDown(HPDataType* a, int n, int parent) {
    assert(a);
    int child = parent * 2 + 1;  //找到左孩子结点
    while (child < n) {  //到最后一个结点结束
        //先比较左右孩子,选择较大的(大顶堆)或较小的(小顶堆)
        if (child + 1 < n && a[child] < a[child + 1]) {
            child++;
        }
        // 比较父节点和子节点,大顶堆时如果父节点小于子节点则交换
        if (a[parent] < a[child]) {
            Swap(&a[parent], &a[child]);
            parent = child; //跳到下一层结点比较
            child = parent * 2 + 1; //更新child结点
        }
        else {
            break;
        }
    }
}

时间复杂度

向下调整算法的时间复杂度也是O(log n),因为最坏情况下需要从根节点调整到叶子节点。

4. 为什么选择向下调整建堆?

从最后一个非叶子节点开始调整的原因

在构建堆时,我们选择从最后一个非叶子节点开始向前依次进行向下调整,这是因为:

  1. 叶子节点没有子节点,已经满足堆的性质,不需要调整

  2. 完全二叉树中,最后一个非叶子节点的索引为(n-1-1)/2(补充:完全二叉树父亲结点的索引是(孩子结点-1)/2,基于初始索引为0的情况,故最后一个非叶子节点的索引为(n-1-1)/2)

各层节点调整次数分析

假设有一个包含n个节点的完全二叉树,高度为h:

  • 第h层(叶子层):有2^(h-1)个节点,不需要调整

  • 第h-1层:有2^(h-2)个节点,每个节点最多需要调整1次

  • 第h-2层:有2^(h-3)个节点,每个节点最多需要调整2次

  • ...

  • 第1层(根节点):有1个节点,最多需要调整h-1次

时间复杂度优势

向下调整建堆的时间复杂度为O(n),而向上调整建堆的时间复杂度为O(n log n)。这是因为:

  • 越高层的节点数量越少,但需要调整的次数越多

  • 越低层的节点数量越多,但需要调整的次数越少

  • 向下调整建堆充分利用了这一特性,使得总调整次数更少

5. 堆排序算法实现

算法步骤

  1. 构建初始堆:将无序数组构建成一个大顶堆(升序排序)

  2. 交换堆顶和末尾元素:将最大元素移到最后

  3. 调整堆:对前n-1个元素重新调整成大顶堆

  4. 重复步骤2-3,直到所有元素有序

算法实现

// 堆排序
void HeapSort(int* a, int n) {
    // 构建初始大顶堆
    for (int i = (n - 1 - 1) / 2; i >= 0; i--) {
        AdjustDown(a, n, i);
    }
    
    // 依次取出堆顶元素并调整
    for (int i = n - 1; i > 0; i--) {
        Swap(&a[0], &a[i]);  // 将堆顶元素(最大值)移到末尾
        AdjustDown(a, i, 0); // 对前i个元素重新调整成大顶堆
    }
}
补充:将堆顶元素移到末尾一是方面统一调整的初始位置,二是方便控制堆顶元素的存放位置

时间复杂度分析

堆排序的时间复杂度由两部分组成:

  1. 建堆过程:O(n)

  2. 排序过程:需要进行n-1次调整,每次调整的时间复杂度为O(log n),因此总时间复杂度为O(n log n)

堆排序的整体时间复杂度为O(n) + O(n log n) = O(n log n),这是一种非常高效的排序算法。

空间复杂度

堆排序是原地排序算法,只需要常数级别的额外空间,空间复杂度为O(1)。

总结

堆排序是一种高效的排序算法,它利用堆这种数据结构的特性来实现排序。通过向下调整算法构建堆,可以以O(n)的时间复杂度完成建堆过程,然后通过n-1次调整完成排序,总时间复杂度为O(n log n)。堆排序是原地排序算法,不需要额外的存储空间,这使得它在处理大数据集时具有很好的性能表现。

理解堆排序的关键在于掌握向上调整和向下调整算法,以及明白为什么从最后一个非叶子节点开始向下调整建堆更加高效。这种算法不仅用于排序,还在优先级队列、Top-K问题等场景中有广泛应用。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值