堆的实现 Heap

堆,物理上看是普通的数组,但是逻辑上是二叉树。它的最大应用是,在海量数据中寻找Top K。

如果是找数据中最大的K个元素、第K大的元素(使用小根堆)。

如果是找数据中最小的K个元素、第K小的元素(使用大根堆)。

注意:

1、堆的一个特点是原地操作,所以不要申请新的空间来存堆,原地操作即可。

2、如果不想自己实现堆,可以用STL-multiset来当作堆使用。

堆的用法:
    这里是把堆作为一种存储数据的载体(和堆排序是不一样的事儿,堆排序只是堆的一种应用场景)。
     宏观上看,堆要实现的接口操作一般为: 
          1、查询堆顶元素

          2、向堆中插入新的元素

          3、从堆中弹出堆顶元素

          4、更新堆顶元素

    微观上看,堆是如何实现这三个接口的:

         1、堆顶元素就是数组的首个元素。

         2、向队尾插入新元素,然后由新元素叶子向根节点方向调整。(堆的初始状态是空的)

         3、取得堆顶元素,将堆尾元素替换过来,然后sink操作。

         4、更新栈顶,然后从堆顶向下调整,sink操作。


数据结构:
一个数组int A[ ] ,  一个当前堆大小int n 
(注意:为了运算方便,A[0]空着不用,数组的空间确保足够使用)


三个操作(实现的是小根堆):
1、返回堆顶元素
A[1]就是堆顶元素。


2、向堆插入新元素 : 参数为(堆,堆大小,插入值) 
void minHeapPush(int A[], int &n, int value)
{
     n++;
     A[n] = value;
     int i = n, p = n/2;
     while(p >= 1 && A[p] > A[i])
     {
          swap(A[p], A[i]);
          i = p;
          p = p/2;
     }
}

3、弹出堆顶元素 : 参数(堆,堆大小)
int minHeapPop(int A[], int &n)
{
     int top = A[1];
     swap(A[1], A[n]);
     n- - ;
     //下面开始sink()
     int i, lc, rc, minc;
     i=1;
     lc = i*2;
     while(lc <= n)
     {
          rc = lc + 1;
          minc = (rc > n)?lc:((A[lc]<A[rc])?lc:rc); //minc为较小的孩子
          if(A[minc] >= A[i])
               break;
          i = minc;
          lc = 2*i;
     }
     return top;
}

4、更新堆顶元素 :参数为(堆,堆大小,堆顶更新值)
void minHeapSetTop(int A[], int n, int value)
{
     A[1] = value;
     //下面也开始sink()
     int i, lc, rc, minc;
     i = 1;
     lc = i*2;
     while(lc <= n)
     {
          rc = lc + 1;
          minc = (rc > n)?lc : ((A[lc]<A[rc])?lc:rc);
          if(A[minc] >= A[i])
               return;
          i = minc;
          lc = 2*i;
     }
} 


PS:以后用上述代码实现堆之后,就可以直接用于适合的场景。

非常好的问题!你提到了 `malloc` 中提到的“heap)”,这是 C 语言内存管理中的一个**核心概念**。下面我们来彻底讲清楚:**什么是heap)?它和栈(stack)有什么区别?它是如何工作的?** --- ### ✅ 什么是Heap)? > **Heap)是程序运行时用于动态分配内存的一块区域**,程序员可以手动申请和释放内存。 - 它由操作系统提供,通过标准库函数如 `malloc`、`calloc`、`realloc` 和 `free` 来管理。 - 和“栈”不同,的生命周期完全由程序员控制 —— 你申请,你就得负责释放。 #### 📌 简单类比: | 类比 | 栈(Stack) | Heap) | |------|-------------|-----------| | 比喻 | 自助餐厅的托盘架(后进先出) | 图书馆借书(任意顺序借还) | | 管理方式 | 自动管理(进入函数分配,离开自动回收) | 手动管理(调用 `malloc` 分配,`free` 释放) | | 使用场景 | 局部变量、函数调用 | 动态数组、链表节点、大对象等 | --- ### 🔍 内存布局总览 一个典型的 C 程序在运行时的内存布局如下: ``` +------------------+ | 栈 (Stack) | ← 向下增长(高地址 → 低地址) | (局部变量) | +------------------+ | | | (Heap) | ← 向上增长(低地址 → 高地址) | (malloc 分配) | +------------------+ | 未初始化数据 | (如 global 变量未初始化) +------------------+ | 已初始化数据 | (如 int x = 10;) +------------------+ | 代码段 | (程序指令) +------------------+ ``` - **栈**:从高地址向低地址增长 - ****:从低地址向高地址增长 - 它们中间是空闲区域,谁需要就往中间“挤” --- ### ✅ 的特点 | 特性 | 说明 | |------|------| | 🟢 动态分配 | 大小可以在运行时决定(比如用户输入 n,再 `malloc(n * sizeof(int))`) | | 🔴 手动管理 | 必须显式调用 `malloc` 和 `free`,否则会导致内存泄漏或崩溃 | | ⏱️ 分配较慢 | 因为涉及系统调用和内存管理算法 | | 🧩 空间碎片化 | 频繁分配/释放可能导致内存不连续,影响性能 | | 🌐 生命周期长 | 分配的内存不会随着函数结束而消失,直到你 `free` 它 | --- ### ✅ 示例:对比栈与上的内存分配 ```c #include <stdio.h> #include <stdlib.h> void stack_example() { int a[1000]; // 在栈上分配 // 函数返回后自动释放 } void heap_example() { int *p = (int*)malloc(1000 * sizeof(int)); // 在上分配 if (p != NULL) { p[0] = 123; printf("p[0] = %d\n", p[0]); free(p); // ❗必须手动释放 p = NULL; } } int main() { stack_example(); heap_example(); return 0; } ``` - `a[1000]`:放在栈上,函数退出自动销毁 - `p` 指向的空间:放在上,除非调用 `free()`,否则一直存在! --- ### ⚠️ 常见错误(相关) #### 1. **忘记 `free()` → 内存泄漏** ```c while (1) { int *p = malloc(1000); // 每次循环都申请,但从不释放 } // 内存很快耗尽 ``` #### 2. **访问已释放的内存(悬空指针)** ```c int *p = malloc(sizeof(int)); *p = 42; free(p); *p = 10; // ❌ 危险!行为未定义 ``` #### 3. **重复释放** ```c free(p); free(p); // ❌ 错误!未定义行为 ``` 建议:`free(p); p = NULL;` 以防止误操作。 #### 4. **越界写入** ```c int *p = malloc(5 * sizeof(int)); for (int i = 0; i < 10; i++) { p[i] = i; // 写到第6个以后就是非法访问 } ``` 这可能会破坏管理结构,导致程序崩溃。 --- ### 💡 什么时候该用? | 场景 | 建议使用的原因 | |------|----------------| | 数组大小在运行时才知道 | 如 `scanf("%d", &n); int *arr = malloc(n * sizeof(int));` | | 数据结构需要动态增删 | 如链表、树、图的节点 | | 要跨函数共享数据 | 栈变量函数返回后就没了,上的还能用 | | 对象太大,怕栈溢出 | 栈空间有限(通常几MB),大数组放更安全 | --- ### 🛠️ 如何调试问题? 推荐工具: - **Valgrind**(Linux):检测内存泄漏、越界、非法访问 - **AddressSanitizer**(GCC/Clang):编译时加 `-fsanitize=address` - **Visual Studio 调试器**(Windows):自带内存诊断功能 示例使用 AddressSanitizer: ```bash gcc -fsanitize=address -g program.c ./a.out ``` 如果发生越界或内存泄漏,会直接报错。 --- ### ✅ 总结 > **Heap)是 C 语言中用于动态内存分配的关键区域**: - 用 `malloc` / `calloc` / `realloc` 分配 - 用 `free` 释放 - 不自动回收,必须手动管理 - 灵活但危险,容易出错 - 是实现高级数据结构的基础 记住一句话: > **栈适合小而生命周期短的数据,适合大而需要长期存在的数据。** ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值