理解 heap --- 实现一个简单的 malloc

本文深入解析 Linux 进程的堆内存管理,包括 heap 的结构、brk 和 sbrk 系统调用的作用。并介绍了如何实现一个简单的 malloc 函数,通过列表管理内存块,包含 block 和 block metadata 两部分。

欢迎分享,微博 老和山小范 ,博客 wsfdl.com

理解 Heap

  high address   +---------------+
                 |               |
                 |     Stack     |
                 |               |
                 +---------------+
                 |       |       |
                 |       v       |
                 |               |
                 |               |
                 +---------------+
                 |      Mmap     |
                 +---------------+
                 |               |
                 |               |
                 |       ^       |
                 |       |       |
                 +---------------+
                 |               |
                 |     Heap      |
                 |               |
                 +---------------+
                 |     Data      | 
                 +---------------+
                 |     Code      |
  low address    +---------------+

上图是 Linux 进程的地址空间,从低位到高位地址分别为:

  • Code Segment: 程序的代码,CPU 执行的指令部分,共享只读。
  • Data Segment: 可细分为初始化数据段和未初始化数据段,常用于存储全局变量等。
  • Stack: 函数以及自动变量(未加 static 的自动变量又称为局部变量)。
  • Mmap: mmap 调用分配的地址空间。
  • Heap: 动态分配内存,如 malloc() 分配的内存。

本文主要讲解 heap,从上图可知,进程的堆是一段连续的空间,它分为三个区域:

  • Mapped region: 该区域的空间已经在物理地址上分配,可以直接被程序使用。
  • Unmapped region: 该区域的空间未在物理地址上分配,需分配后才可以使用。
  • Unusable region: 不可使用的地址空间,超出 rlimit 的空间都是不可使用的,不同的硬件和操作系统下,rlimit 可能各不相同。

其中 break 和 rlimit 是三个区域的分界线:

  • break: mapped region 和 unmapped region 的分界线,可调用 sbrk(0) 返回当前的 break。
  • rlimit: 堆能分配的最大地址空间,getrlimit(2) 可获取 rlimit。
  • start of heap: 堆的起始地址,当堆上从未开辟空间时,sbrk(0) 返回的就是堆的起始地址,也可在 /proc/{proc_id}/mapping 获取堆的起始地址。
                         Heap

   high address  +-------------------+
                 |                   |
                 |  Unusable Region  |
                 |                   |
#include <stdio.h> #include <stdlib.h> // 最小堆结构体 typedef struct { int *data; int size; int capacity; } MinHeap; // 交换两个整数 void swap(int *a, int *b) { int temp = *a; *a = *b; *b = temp; } // 初始化最小堆 MinHeap* initHeap(int capacity) { MinHeap *heap = (MinHeap*)malloc(sizeof(MinHeap)); heap->data = (int*)malloc(capacity * sizeof(int)); heap->size = 0; heap->capacity = capacity; return heap; } // 上滤操作 void siftUp(MinHeap *heap, int index) { while (index > 0 && heap->data[index] < heap->data[(index - 1) / 2]) { swap(&heap->data[index], &heap->data[(index - 1) / 2]); index = (index - 1) / 2; } } // 插入元素到最小堆 void insert(MinHeap *heap, int value) { if (heap->size < heap->capacity) { heap->data[heap->size] = value; siftUp(heap, heap->size++); } } // 下滤操作 void siftDown(MinHeap *heap, int index) { int left, right, smallest; while (1) { left = 2 * index + 1; right = 2 * index + 2; smallest = index; if (left < heap->size && heap->data[left] < heap->data[smallest]) smallest = left; if (right < heap->size && heap->data[right] < heap->data[smallest]) smallest = right; if (smallest == index) break; swap(&heap->data[index], &heap->data[smallest]); index = smallest; } } // 提取最小元素 int extractMin(MinHeap *heap) { if (heap->size == 0) return -1; int min = heap->data[0]; heap->data[0] = heap->data[--heap->size]; siftDown(heap, 0); return min; } // 销毁最小堆 void destroyHeap(MinHeap *heap) { free(heap->data); free(heap); } int main() { MinHeap *heap = initHeap(10); insert(heap, 3); insert(heap, 1); insert(heap, 2); printf("Extracted Min: %d\n", extractMin(heap)); printf("Extracted Min: %d\n", extractMin(heap)); destroyHeap(heap); return 0; }帮我简洁优化一下
最新发布
11-27
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值