Linux内核空间内存申请函数kmalloc、kzalloc、vmalloc的区别[转]

最新推荐文章于 2024-12-24 17:20:54 发布

转载最新推荐文章于 2024-12-24 17:20:54 发布 · 752 阅读

linux device driver 专栏收录该内容

12 篇文章

订阅专栏

本文介绍了Linux内核中kmalloc(), kzalloc(), vmalloc()等内存分配函数的使用方法及其区别。详细解释了不同函数的应用场景，如kmalloc()适用于小于128KB的内存分配，vmalloc()适用于大块内存分配。

转自：https://www.cnblogs.com/sky-heaven/p/7390370.html

我们都知道在用户空间动态申请内存用的函数是 malloc()，这个函数在各种操作系统上的使用是一致的，对应的用户空间内存释放函数是 free()。注意：动态申请的内存使用完后必须要释放，否则会造成内存泄漏，如果内存泄漏发生在内核空间，则会造成系统崩溃。

　　那么，在内核空间中如何申请内存呢？一般我们会用到 kmalloc()、kzalloc()、vmalloc() 等，下面我们介绍一下这些函数的使用以及它们之间的区别。

kmalloc()

函数原型：

void *kmalloc(size_t size, gfp_t flags)；

　　kmalloc() 申请的内存位于物理内存映射区域，而且在物理上也是连续的，它们与真实的物理地址只有一个固定的偏移，因为存在较简单的转换关系，所以对申请的内存大小有限制，不能超过128KB。
　　
较常用的 flags（分配内存的方法）：

GFP_ATOMIC —— 分配内存的过程是一个原子过程，分配内存的过程不会被（高优先级进程或中断）打断；
GFP_KERNEL —— 正常分配内存；
GFP_DMA —— 给 DMA 控制器分配内存，需要使用该标志（DMA要求分配虚拟地址和物理地址连续）。

void kfree(const void *objp);

kzalloc()

　　kzalloc() 函数与 kmalloc() 非常相似，参数及返回值是一样的，可以说是前者是后者的一个变种，因为 kzalloc() 实际上只是额外附加了 __GFP_ZERO 标志。所以它除了申请内核内存外，还会对申请到的内存内容清零。

/** * kzalloc - allocate memory. The memory is set to zero. * @size: how many bytes of memory are required. * @flags: the type of memory to allocate (see kmalloc). */static inline void *kzalloc(size_t size, gfp_t flags){    return kmalloc(size, flags | __GFP_ZERO);}

kzalloc() 对应的内存释放函数也是 kfree()。

vmalloc()

函数原型：

void *vmalloc(unsigned long size);

　　vmalloc() 函数则会在虚拟内存空间给出一块连续的内存区，但这片连续的虚拟内存在物理内存中并不一定连续。由于 vmalloc() 没有保证申请到的是连续的物理内存，因此对申请的内存大小没有限制，如果需要申请较大的内存空间就需要用此函数了。

对应的内存释放函数为：

void vfree(const void *addr);

注意：vmalloc() 和 vfree() 可以睡眠，因此不能从中断上下文调用。
　　

总结

kmalloc()、kzalloc()、vmalloc() 的共同特点是：

用于申请内核空间的内存；
内存以字节为单位进行分配；
所分配的内存虚拟地址上连续；

kmalloc()、kzalloc()、vmalloc() 的区别是：

kzalloc 是强制清零的 kmalloc 操作；（以下描述不区分 kmalloc 和 kzalloc）
kmalloc 分配的内存大小有限制（128KB），而 vmalloc 没有限制；
kmalloc 可以保证分配的内存物理地址是连续的，但是 vmalloc 不能保证；
kmalloc 分配内存的过程可以是原子过程（使用 GFP_ATOMIC），而 vmalloc 分配内存时则可能产生阻塞；
kmalloc 分配内存的开销小，因此 kmalloc 比 vmalloc 要快；

一般情况下，内存只有在要被 DMA 访问的时候才需要物理上连续，但为了性能上的考虑，内核中一般使用 kmalloc()，而只有在需要获得大块内存时才使用 vmalloc()。例如，当模块被动态加载到内核当中时，就把模块装载到由 vmalloc() 分配的内存上。

转自：http://www.cnblogs.com/sky-heaven/p/8144423.html

内存映射结构：

1.32位地址线寻址4G的内存空间，其中0-3G为用户程序所独有，3G-4G为内核占有。

2.struct page：整个物理内存在初始化时，每个4kb页面生成一个对应的struct page结构，这个page结构就独一无二的代表这个物理内存页面，并存放在mem_map全局数组中。

3.段式映射：首先根据代码段选择子cs为索引，以GDT值为起始地址的段描述表中选择出对应的段描述符，随后根据段描述符的基址，本段长度，权限信息等进行校验，校验成功后。cs:offset中的32位偏移量直接与本段基址相累加，得出最终访问地址。

0-3G与mem_map的映射方式：
因linux中采用的段式映射为flat模式，所以从逻辑地址到线性地址没有变化。从段式出来进入页式，每个用户进程都独自拥有一个页目录表（pdt），运行时存放于CR3。 CR3（页目录） + 前10位 => 页面表基址 + 中10位 => 页表项 + 后12位 => 物理页面地址

3G-4G与mem_map的映射方式：
分为三种类型：低端内存/普通内存/高端内存。
低端内存：3G-3G+16M 用于DMA        __pa线性映射
普通内存：3G+16M-3G+896M          __pa线性映射（若物理内存<896M，则分界点就在3G+实际内存）
高端内存：3G+896-4G               采用动态的分配方式

4.高端内存(假设3G+896为高端内存起址)
作用：访问到1G以外的物理内存空间。
线性地址共分为三段：vmalloc段/kmap段/kmap_atomic段（针对与不同的内存分配方式）

从内存分配函数的结构来看主要分为下面几个部分:
a.伙伴算法(最原始的面向页的分配方式)
alloc_pages 接口：
   struct page * alloc_page(unsigned int gfp_mask)——分配一页物理内存并返回该页物理内存的page结构指针。
   struct page * alloc_pages(unsigned int gfp_mask, unsigned int order)——分配个连续的物理页并返回分配的第一个物理页的page结构指针。
   <释放函数：__free_page(s)>

   内核中定义：#define alloc_page(gfp_mask) alloc_pages(gfp_mask, 0)
   最终都是调用 __alloc_pages.
   其中MAX_ORDER 11，及最大分配到到页面个数为2^10（即4M）。
   分配页后还不能直接用，需要得到该页对应的虚拟地址：
   void *page_address(struct page *page);
   低端内存的映射方式：__va((unsigned long)(page - mem_map) << 12)
   高端内存到映射方式：struct page_address_map分配一个动态结构来管理高端内存。(内核是访问不到vma的3G以下的虚拟地址的) 具体映射由kmap / kmap_atomic执行。

get_free_page接口：(alloc_pages接口两步的替代函数)
   unsigned long get_free_page(unsigned int gfp_mask)
   unsigned long __get_free_page(unsigned int gfp_mask)
   Unsigned long __get_free_pages(unsigned int gfp_mask, unsigned int order)
   <释放函数：free_page>
   与alloc_page(s)系列最大的区别是无法申请高端内存，因为它返回到是一个线性地址，而高端内存是需要额外映射才可以访问的。

b.slab高速缓存（反复分配很多同一大小内存）   注：使用较少
   kmem_cache_t* xx_cache;
   创建： xx_cache = kmem_cache_create("name", sizeof(struct xx), SLAB_HWCACHE_ALIGN, NULL, NULL);
   分配： kmem_cache_alloc(xx_cache, GFP_KERNEL);
   释放： kmem_cache_free(xx_cache, addr);
内存池
   mempool 不使用。

c.kmalloc（最常用的分配接口）         注：必须小于128KB
   GFP_ATOMIC 不休眠，用于中断处理等情况
   GFP_KERNEL 会休眠，一般状况使用此标记
   GFP_USER   会休眠
   __GFP_DMA 分配DMA内存
   kmalloc/kfree

d.vmalloc/vfree
   vmalloc采用高端内存预留的虚拟空间来收集内存碎片引起的不连续的物理内存页，是用于非连续物理内存分配。
当kmalloc分配不到内存且无物理内存连续的需求时，可以使用。（优先从高端内存中查找）

e.ioremap()/iounmap()
　　ioremap()的作用是把device寄存器和内存的物理地址区域映射到内核虚拟区域，返回值为内核的虚拟地址。使用的线性地址区间也在vmmlloc段
注：
vmalloc()与 alloc_pages(_GFP_HIGHMEM)+kmap()；前者不连续，后者只能映射一个高端内存页面
__get_free_pages与alloc_pages(NORMAL)+page_address()；两者完全等同
内核地址通过 __va/__pa进行中低内存的直接映射
高端内存采用kmap/kmap_atomic的方式来映射


个人总结如下：
a.在<128kB的一般内存分配时，使用kmalloc
   允许睡眠：GFP_KERNEL
   不允许睡眠：GFP_ATOMIC
b.在>128kB的内存分配时，使用get_free_pages，获取成片页面，直接返回虚拟地址（<4M）（或alloc_pages + page_address）
c.b失败，
   如果要求分配高端内存：alloc_pages(_GFP_HIGHMEM)+kmap（仅能映射一个页面）
   如果不要求内存连续：则使用vmalloc进行分配逻辑连续的大块页面.(不建议)/分配速度较慢，访问速率较慢。
d.频繁创建和销毁很多较大数据结构,使用slab.
e.高端内存映射：
   允许睡眠：kmap              (永久映射)
   不允许睡眠：kmap_atomic      (临时映射)会覆盖以前到映射（不建议）