堆排序(Heap Sort)是一种基于比较的排序算法,其核心思想是利用堆这种数据结构的特性来进行排序。堆是一种特殊的完全二叉树,具有以下性质:
- 最大堆:在最大堆中,每个节点的值都大于或等于其子节点的值,最大值位于堆顶。
- 最小堆:在最小堆中,每个节点的值都小于或等于其子节点的值,最小值位于堆顶。
堆排序的基本步骤
堆排序可以分为两个主要阶段:
-
构建最大堆:
- 将待排序的数组构建成一个最大堆。这可以通过从最后一个非叶子节点开始,逐步向上调用堆化(Heapify)函数来完成。
- 堆化是一个调整操作,确保当前节点和其子树满足最大堆的性质。
-
根删除-根修复:
- 将堆顶元素(即最大值)与当前堆的最后一个元素交换,然后减少堆的大小。(相当于删除堆顶元素)
- 对新的堆顶元素进行堆化,恢复最大堆的性质。(根修复)
- 重复上述步骤,直到堆的大小为1。
堆排序的复杂度
- 时间复杂度:
- 最佳情况、最坏情况和平均情况均为 (O(n \log n)),因为每次堆化操作的时间复杂度为 (O(\log n)),需要进行 (n) 次这样的操作。
- 空间复杂度:堆排序是原地排序算法,其空间复杂度为 (O(1)),只需使用常量级的额外空间。
堆排序的优缺点
优点:
- 不需要额外的存储空间,节省内存。
- 在大数据集上,时间复杂度比较稳定,适合处理大规模数据。
缺点:
- 相比快速排序,堆排序的常数因子较大,因此在小规模数据时效率较低。
- 不稳定排序:堆排序不能保持相等元素的相对顺序。
#include <stdio.h>
void BuildHeap(int a[], int n);
void HeapSort(int a[], int n);
void Heapify(int a[], int n, int i);
int main() {
int i;
int a[5] = {-12, 6, 89, 2, 0};
HeapSort(a, 5);
for (i = 0; i < 5; i++) {
printf("%d ", a[i]);
}
return 0;
}
void Heapify(int a[], int n, int i) {
int largest = i; // 初始化最大值为当前节点
int left = 2 * i + 1; // 左子节点
int right = 2 * i + 2; // 右子节点
// 如果左子节点存在且大于当前最大值
if (left < n && a[left] > a[largest]) {
largest = left;
}
// 如果右子节点存在且大于当前最大值
if (right < n && a[right] > a[largest]) {
largest = right;
}
// 如果最大值不是当前节点
if (largest != i) {
// 交换当前节点与最大节点
int temp = a[i];
a[i] = a[largest];
a[largest] = temp;
// 递归堆化受影响的子树
Heapify(a, n, largest);
}
}
void BuildHeap(int a[], int n) {
int i;
// 从最后一个非叶子节点开始,向上调整堆
for (i = n / 2 - 1; i >= 0; i--) {
Heapify(a, n, i);
}
}
void HeapSort(int a[], int n) {
int i;
BuildHeap(a, n); // 构建最大堆
// 将最大元素放到数组的末尾并调整堆
for (i = n - 1; i > 0; i--) {
// 交换堆顶(最大值)与当前最后一个值
int temp = a[i];
a[i] = a[0];
a[0] = temp;
// 调整堆的大小,堆的有效大小减一
Heapify(a, i, 0);
}
}