[特殊字符]算法详解——堆排序：金字塔里的排序艺术，一文搞懂原理与优化！

最新推荐文章于 2025-04-30 07:00:00 发布

原创最新推荐文章于 2025-04-30 07:00:00 发布 · 816 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #java #开发语言 #堆排序

🔥堆排序：金字塔里的排序艺术，一文搞懂原理与优化！

🔥为了更好的让大家理解算法这里推荐一个算法可视化的网站https://staying.fun/zh/features/algorithm-visualize

复制文章中JavaScript代码示例到这个网站上就可以看到可视化算法运算的过程了！大家快点来试试吧！！！！

一、堆排序的本质：金字塔中的优先级管理

在这里插入图片描述

堆排序是一种基于完全二叉树的高效排序算法，通过维护堆的性质实现数据排序。它的核心思想是：1. 构建堆结构：将数组转换为大顶堆（父节点≥子节点）或小顶堆（父节点≤子节点）。

2. 交换与调整：将堆顶元素与末尾元素交换，缩小堆范围后重新调整堆，最终得到有序数组。💡 类比场景：班级选班长，每次选最高的同学站到队伍末尾，直到所有人排好序。

二、堆排序的 JavaScript 实现

2.1 堆结构基础

在实现堆排序前，我们先了解堆的基本操作：

// 交换数组中两个元素的位置

function swap(arr, i, j) {

   let temp = arr[i];

   arr[i] = arr[j];

   arr[j] = temp;

}

// 调整以index为根的子树，使其成为大顶堆

function maxHeapify(arr, index, heapSize) {

   let left = index * 2 + 1; // 左子节点索引

   let right = index * 2 + 2; // 右子节点索引

   let largest = index; // 初始化最大值为根节点

   // 如果左子节点大于根节点

   if (left < heapSize && arr[left] > arr[largest]) {

       largest = left;

   }

   // 如果右子节点大于当前最大值

   if (right < heapSize && arr[right] > arr[largest]) {

       largest = right;

   }

   // 如果最大值不是根节点

   if (largest!== index) {

       swap(arr, index, largest);

       // 递归调整受影响的子树

       maxHeapify(arr, largest, heapSize);

   }

}

2.2 堆排序主逻辑

有了上述基础，我们来实现堆排序的主函数：

function heapSort(arr) {

   let len = arr.length;

   // 构建大顶堆

   for (let i = Math.floor(len / 2) - 1; i >= 0; i--) {

       maxHeapify(arr, i, len);

   }

   // 逐步将堆顶元素与末尾元素交换，调整堆结构

   for (let i = len - 1; i > 0; i--) {

       swap(arr, 0, i);

       maxHeapify(arr, 0, i);

   }

   return arr;

}

// 测试堆排序

let array = [3, 6, 8, 10, 1, 2, 1];

console.log(heapSort(array));

代码解释：

swap 函数：用于交换数组中两个元素的位置。

maxHeapify 函数：确保以 index 为根的子树满足大顶堆性质。

heapSort 函数：先构建大顶堆，然后通过不断交换堆顶元素与末尾元素，并调整堆结构，最终得到有序数组。

三、算法关键点解析

3.1 完全二叉树存储

堆排序利用数组来表示完全二叉树，这种存储方式简洁高效。在数组中，若父节点索引为 i ，则其左子节点索引为 2i + 1，右子节点索引为 2i + 2。例如，数组 [3, 6, 8, 10, 1, 2, 1] ，索引 0 处的元素 3 是根节点，其左子节点 6 的索引为 2 * 0 + 1 = 1，右子节点 8 的索引为 2 * 0 + 2 = 2 。

非叶子节点的范围是从 0 到Math.floor(size/2) - 1 ，理解这一点对于堆的构建和调整至关重要。

3.2 堆调整策略

下沉（shift down）：在构建堆和交换元素后，需要将不符合堆性质的节点下沉。从根节点开始，比较节点与其子节点，将最大值（大顶堆）或最小值（小顶堆）移动到正确位置，逐层向下调整，直到满足堆性质。比如在大顶堆中，若根节点小于某个子节点，就交换它们的位置，然后继续对交换后的子节点进行同样的操作。

上浮（shift up）：当插入新元素时，新元素可能破坏堆的性质，需要将其上浮。从新元素的位置开始，逐层比较其父节点，若大于（大顶堆）或小于（小顶堆）父节点，则交换位置，直到满足堆性质。

3.3 稳定性问题

堆排序是一种不稳定的排序算法。在排序过程中，相同元素的相对顺序可能会发生改变。例如，对于数组 [5, 5, 1] ，排序后可能变为 [1, 5, 5] ，两个 5 的顺序发生了变化。

四、算法复杂度分析

时间复杂度：堆排序的时间复杂度为 O (n log n) 。构建堆的时间复杂度为 O (n) ，因为从下往上调整堆时，每个非叶子节点最多需要 O (1) 次比较和交换操作，而总的非叶子节点数约为 n/2 。在排序阶段，每次交换堆顶元素和末尾元素后，调整堆的时间复杂度为 O (log n) ，共需要 n - 1 次交换和调整，所以这部分时间复杂度为 O (n log n) 。综合起来，堆排序的总时间复杂度为 O (n log n) 。在最坏情况下，比如数组初始为逆序时，堆排序依然保持 O (n log n) 的时间复杂度，这体现了其稳定性。在处理大规模数据时，相比时间复杂度为 O (n^2) 的冒泡排序、选择排序，堆排序优势明显。假设处理 10 万个数据，冒泡排序可能要花费数小时，而堆排序可能只需几秒。

空间复杂度：堆排序是一种原地排序算法，空间复杂度为 O (1) 。在排序过程中，除了输入数组本身，只需几个临时变量用于交换和调整堆，不需要额外的大量内存空间。这使得堆排序在内存敏感的场景中表现出色，比如在嵌入式系统、低配置设备中进行数据排序时，无需担心内存不足问题。

适用场景：堆排序适用于大规模数据排序，因其稳定的 O (n log n) 时间复杂度，能高效处理大量数据。在内存敏感的场景中，如操作系统的任务调度、数据库索引排序等，堆排序的原地排序特性可有效节省内存。

五、优化策略与拓展

5.1 减少比较次数

在堆排序中，每次调整堆时，我们通常会比较当前节点与其左右子节点。通过路径压缩技术，可以减少这种比较次数。具体做法是，在比较时，先找出左右子节点中较大（大顶堆）或较小（小顶堆）的那个，然后仅将当前节点与这个较大或较小的子节点进行比较。这样可以避免每次都进行两次比较，从而提高效率。例如：

// 优化后的调整堆函数，减少比较次数

function optimizedMaxHeapify(arr, index, heapSize) {

   let left = index * 2 + 1;

   let right = index * 2 + 2;

   let largest = index;

   // 先找出左右子节点中较大的那个

   if (left < heapSize && right < heapSize) {

       let largerChild = arr[left] > arr[right]? left : right;

       if (arr[largerChild] > arr[largest]) {

           largest = largerChild;

       }

   } else if (left < heapSize) {

       if (arr[left] > arr[largest]) {

           largest = left;

       }

   } else if (right < heapSize) {

       if (arr[right] > arr[largest]) {

           largest = right;

       }

   }

   if (largest!== index) {

       swap(arr, index, largest);

       optimizedMaxHeapify(arr, largest, heapSize);

   }

}

5.2 混合排序优化

对于小数组，堆排序的递归调用和调整操作可能会带来额外开销。此时，可以结合插入排序等简单排序算法。插入排序在小数组上性能较好，当数组大小小于某个阈值（如 10 ）时，使用插入排序替代堆排序的部分操作，能减少整体的时间开销。示例代码如下：

function insertionSort(arr) {

   for (let i = 1; i < arr.length; i++) {

       let key = arr[i];

       let j = i - 1;

       while (j >= 0 && arr[j] > key) {

           arr[j + 1] = arr[j];

           j--;

       }

       arr[j + 1] = key;

   }

   return arr;

}

function optimizedHeapSort(arr) {

   let len = arr.length;

   if (len < 10) {

       return insertionSort(arr);

   }

   for (let i = Math.floor(len / 2) - 1; i >= 0; i--) {

       maxHeapify(arr, i, len);

   }

   for (let i = len - 1; i > 0; i--) {

       swap(arr, 0, i);

       maxHeapify(arr, 0, i);

   }

   return arr;

}

let testArray = [5, 2, 4, 6, 1, 3];

console.log(optimizedHeapSort(testArray));

5.3 原地堆排序

直接在原数组上操作，避免复制数组的额外开销。

在构建堆和排序过程中，直接对原数组进行调整和交换，不使用额外的数组空间。前面实现的堆排序代码已经是原地堆排序，每次交换和调整都是在原数组上进行，空间复杂度为 O (1) 。例如在heapSort函数中：

function heapSort(arr) {

   let len = arr.length;

   // 构建大顶堆

   for (let i = Math.floor(len / 2) - 1; i >= 0; i--) {

       maxHeapify(arr, i, len);

   }

   // 逐步将堆顶元素与末尾元素交换，调整堆结构

   for (let i = len - 1; i > 0; i--) {

       swap(arr, 0, i);

       maxHeapify(arr, 0, i);

   }

   return arr;

}

在这个函数中，无论是构建堆还是交换元素调整堆，都是直接对arr数组进行操作，没有创建新的数组来辅助排序，从而实现了原地堆排序。

六、应用场景与优缺点

6.1 优点

高效稳定：堆排序的时间复杂度稳定为 O (n log n) ，这使得它在处理大规模数据时表现出色。无论数据的初始状态如何，都能保证相对稳定的排序效率。例如在数据库中对大量记录进行排序时，堆排序的高效性可大大缩短处理时间。

原地排序：无需额外辅助空间，空间复杂度为 O (1) 。这意味着在内存有限的情况下，堆排序依然能够正常工作，不会因为内存不足而导致排序失败。在嵌入式系统中，内存资源紧张，堆排序的原地排序特性就显得尤为重要。

6.2 缺点

不稳定：堆排序是一种不稳定的排序算法。在排序过程中，相同元素的相对顺序可能会发生改变。比如在一个包含多个相同分数的学生成绩列表中，使用堆排序后，原本成绩相同的学生顺序可能会变化，这在一些对顺序敏感的场景中可能会带来问题。

实现复杂：堆排序的实现需要熟练掌握堆的构建和调整逻辑，对于初学者来说，理解和实现起来有一定难度。在实际应用中，一旦堆调整逻辑出现错误，可能导致排序结果不正确。

6.3 典型应用

优先队列：堆排序常用于实现优先队列，在任务调度系统中，每个任务都有不同的优先级，优先队列可以根据任务的优先级来安排执行顺序，确保高优先级的任务先被处理。在操作系统的进程调度中，就可以利用优先队列来管理进程，提高系统的响应速度。

外部排序：当数据量过大，无法一次性加载到内存中时，堆排序的原地排序特性使其非常适合用于外部排序。通过将数据分成多个块，逐块进行排序并合并，最终得到有序的结果。在处理大型日志文件排序时，外部排序就可以发挥作用。

算法竞赛：在算法竞赛中，堆排序常被用于解决 “前 K 大元素”“前 K 小元素” 等问题。通过构建一个大小为 K 的堆，可以高效地找出数组中的前 K 个最大或最小元素。在寻找一组数据中最大的 10 个数时，利用堆排序就能快速得到结果。

七、避坑指南

在实现堆排序时，有几个常见的陷阱需要注意：

索引越界：在计算子节点索引时，要确保索引在数组范围内。如在maxHeapify函数中，left和right索引必须小于heapSize ，否则会导致数组越界错误。例如，如果heapSize为 5 ，而计算出的right索引为 5 ，就会访问到不存在的数组元素。在实际编写代码时，要时刻检查索引计算是否正确，避免此类错误。

初始建堆：建堆时应从最后一个非叶子节点开始调整，而不是从根节点开始。最后一个非叶子节点的索引为Math.floor(len / 2) - 1 ，从这个节点开始向下调整，能确保每个子树都满足堆的性质。如果从根节点开始调整，可能会导致堆的构建不正确。例如，对于数组 [3, 6, 8, 10, 1, 2, 1] ，如果从根节点 3 开始调整，而不是从索引为 2 的节点 8 开始调整，最终构建的堆可能不是正确的大顶堆。

边界条件：要妥善处理空数组或单元素数组的情况。对于空数组，直接返回空数组即可；对于单元素数组，也直接返回该数组，因为它本身就是有序的。在heapSort函数开头添加对这些情况的判断，能使代码更加健壮。例如：

function heapSort(arr) {

   if (arr.length <= 1) {

       return arr;

   }

   // 后续代码

}

在实际应用中，充分考虑这些边界条件，可以避免程序在处理特殊输入时出现错误，提高代码的稳定性和可靠性。

八、总结

堆排序通过巧妙的金字塔结构实现高效排序，是分治思想的经典应用。虽然实现稍复杂，但其 O (n log n) 的时间复杂度和原地排序特性，使其在内存敏感场景中表现优异。掌握堆排序，不仅能提升算法能力，还能为理解优先队列、堆优化等高级主题打下基础。快去试试把代码复制到编辑器，直观感受堆排序的执行过程吧！# 排序算法 #堆排序 #JavaScript #数据结构