堆和优先队列的实现与应用-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_31800911/article/details/146489592

堆和优先队列的实现与应用

背景简介

堆（Heap）是一种特殊的完全二叉树，通常用数组来实现。它允许插入和删除操作，使得最小或最大元素能够快速被访问。堆广泛应用于优先队列、堆排序等算法中。本文将详细介绍堆和优先队列的内部机制，并探讨其在内存中的实现方式。

堆的形状和内容属性

堆具有两个基本属性：形状属性和内容属性。形状属性确保堆是一个完全二叉树，内容属性定义了堆中父节点与子节点之间的大小关系。最小堆中，每个父节点的值都小于其子节点的值；而在最大堆中，则是每个父节点的值都大于其子节点的值。

形状属性

堆的高度 h 与堆的大小 n 之间的关系是 h = Θ(log2 n)，这说明堆的高度总是对数级别的。

内容属性

最小堆 ：最小值始终在根节点。
最大堆 ：最大值始终在根节点。

堆在内存中的实现

通过按层编号的方式对堆中的节点进行编号，可以确定任何节点的父节点和子节点的位置关系。节点编号 i 的子节点编号为 2i + 1 和 2i + 2，父节点编号为 (i - 1)/2。利用这一性质，我们可以仅用一个数组来表示整个堆结构。

堆的操作：插入和删除最小元素

堆的操作包括插入新元素和删除最小元素（在最小堆中）或最大元素（在最大堆中）。

插入操作

新元素被插入到堆的最左边的未使用叶子节点中。然后通过向上渗透（upward percolation）的方式，与父节点比较并交换，直到满足堆的内容属性。

删除最小元素

删除最小元素的过程分为两个阶段： - 阶段 1 ：记录根节点的值，并用最后一个叶子节点的值替换它。 - 阶段 2 ：通过向下渗透（downward percolation）的方式，与子节点比较并交换，直到满足堆的内容属性。

堆的编程实现

在不同的编程语言中实现堆时，需要考虑数组大小是否可变。例如，Python 允许动态数组，但 C 和 Java 中数组大小固定，需要额外的逻辑来处理数组的扩容。

Python 实现

Python 中使用列表（list）即可轻松实现堆，因为列表是动态的。

import heapq

def insert_in_heap(heap, x):
    heapq.heappush(heap, x)

def remove_min_from_heap(heap):
    return heapq.heappop(heap)

C 或 Java 实现

C 和 Java 中使用数组实现堆时，需要手动管理数组的扩容和缩容。

#include <stdio.h>

void swap(int *a, int *b) {
    int temp = *a;
    *a = *b;
    *b = temp;
}

void heapify(int arr[], int n, int i) {
    int smallest = i;
    int left = 2 * i + 1;
    int right = 2 * i + 2;

    if (left < n && arr[left] < arr[smallest])
        smallest = left;
    if (right < n && arr[right] < arr[smallest])
        smallest = right;

    if (smallest != i) {
        swap(&arr[i], &arr[smallest]);
        heapify(arr, n, smallest);
    }
}

void minHeapify(int arr[], int n) {
    for (int i = n / 2 - 1; i >= 0; i--)
        heapify(arr, n, i);
}

总结与启发

堆和优先队列是高效处理优先级和排序问题的强大数据结构。理解堆的内部机制及其在内存中的实现，可以帮助我们在实际编程中更加灵活地应用这些概念。无论是动态语言还是静态语言，通过合理地使用数组和适当的算法，我们都可以实现功能完备的堆结构。希望本文能够加深你对堆和优先队列的理解，并在实际应用中发挥它们的作用。