linux内核Kmalloc分配内存需要注意的问题(GFP_KERNEL可能会造成内核调度错误)

#include <Linux/slab.h> void *kmalloc(size_t size, int flags);

给 kmalloc 的第一个参数是要分配的块的大小. 第 2 个参数, 分配标志, 非常有趣, 因为它以几个方式控制 kmalloc 的行为.

最一般使用的标志, GFP_KERNEL, 意思是这个分配((内部最终通过调用 __get_free_pages 来进行, 它是 GFP_ 前缀的来源) 代表运行在内核空间的进程而进行的. 换句话说, 这意味着调用函数是代表一个进程在执行一个系统调用. 使用 GFP_KENRL 意味着 kmalloc 能够使当前进程在少内存的情况下睡眠来等待一页. 一个使用 GFP_KERNEL 来分配内存的函数必须, 因此, 是可重入的并且不能在原子上下文中运行. 当当前进程睡眠, 内核采取正确的动作来定位一些空闲内存, 或者通过刷新缓存到磁盘或者交换出去一个用户进程的内存.

GFP_KERNEL 不一直是使用的正确分配标志; 有时 kmalloc 从一个进程的上下文的外部调用. 例如, 这类的调用可能发生在中断处理, tasklet, 和内核定时器中. 在这个情况下, 当前进程不应当被置为睡眠, 并且驱动应当使用一个 GFP_ATOMIC 标志来代替. 内核正常地试图保持一些空闲页以便来满足原子的分配. 当使用 GFP_ATOMIC 时, kmalloc 能够使用甚至最后一个空闲页. 如果这最后一个空闲页不存在, 但是, 分配失败.

其他用来代替或者增添 GFP_KERNEL 和 GFP_ATOMIC 的标志, 尽管它们 2 个涵盖大部分设备驱动的需要. 所有的标志定义在 <linux/gfp.h>, 并且每个标志用一个双下划线做前缀, 例如 __GFP_DMA. 另外, 有符号代表常常使用的标志组合; 这些缺乏前缀并且有时被称为分配优先级. 后者包括:

GFP_ATOMIC

用来从中断处理和进程上下文之外的其他代码中分配内存. 从不睡眠.

GFP_KERNEL

内核内存的正常分配. 可能睡眠.

GFP_USER

用来为用户空间页来分配内存; 它可能睡眠.

GFP_HIGHUSER

如同 GFP_USER, 但是从高端内存分配, 如果有. 高端内存在下一个子节描述.

GFP_NOIO
GFP_NOFS

这个标志功能如同 GFP_KERNEL, 但是它们增加限制到内核能做的来满足请求. 一个 GFP_NOFS 分配不允许进行任何文件系统调用, 而 GFP_NOIO 根本不允许任何 I/O 初始化. 它们主要地用在文件系统和虚拟内存代码, 那里允许一个分配睡眠, 但是递归的文件系统调用会是一个坏注意.

上面列出的这些分配标志可以是下列标志的相或来作为参数, 这些标志改变这些分配如何进行:

__GFP_DMA

这个标志要求分配在能够 DMA 的内存区. 确切的含义是平台依赖的并且在下面章节来解释.

__GFP_HIGHMEM

这个标志指示分配的内存可以位于高端内存.

__GFP_COLD

正常地, 内存分配器尽力返回"缓冲热"的页 -- 可能在处理器缓冲中找到的页. 相反, 这个标志请求一个"冷"页, 它在一段时间没被使用. 它对分配页作 DMA 读是有用的, 此时在处理器缓冲中出现是无用的. 一个完整的对如何分配 DMA 缓存的讨论看"直接内存存取"一节在第 1 章.

__GFP_NOWARN

这个很少用到的标志阻止内核来发出警告(使用 printk ), 当一个分配无法满足.

__GFP_HIGH

这个标志标识了一个高优先级请求, 它被允许来消耗甚至被内核保留给紧急状况的最后的内存页.

__GFP_REPEAT
__GFP_NOFAIL
__GFP_NORETRY

这些标志修改分配器如何动作, 当它有困难满足一个分配. __GFP_REPEAT 意思是" 更尽力些尝试" 通过重复尝试 -- 但是分配可能仍然失败. __GFP_NOFAIL 标志告诉分配器不要失败; 它尽最大努力来满足要求. 使用 __GFP_NOFAIL 是强烈不推荐的; 可能从不会有有效的理由在一个设备驱动中使用它. 最后, __GFP_NORETRY 告知分配器立即放弃如果得不到请求的内存.

kmalloc 能够分配的内存块的大小有一个上限. 这个限制随着体系和内核配置选项而变化. 如果你的代码是要完全可移植, 它不能指望可以分配任何大于 128 KB. 如果你需要多于几个 KB, 但是, 有个比 kmalloc 更好的方法来获得内存, 我们在本章后面描述.

这方面的原因:

kmalloc并不直接从分页机制中获得空闲页面而是从slab页面分配器那儿获得需要的页面,slab的实现代码限制了最大分配的大小为128k,即131072bytes,理论上你可以通过更改slab.c中的 cache_sizes数组中的最大值使得kmalloc可以获得更大的页面数,不知道有没有甚么副效应或者没有必要这样做,因为获取较大内存的方法有很多,想必128k是经验总结后的合适值。

alloc_page( )可以分配的最大连续页面是4M吧。MAX_ORDER =10

46 static inline struct page * alloc_pages(unsigned int gfp_mask, unsigned int order) 
47 { 
48 /* 
49 * Gets optimized away by the compiler. 
50 */ 
51 if (order >= MAX_ORDER) 
52 return NULL; 
53 return _alloc_pages(gfp_mask, order); 
54 } 
alloc_pages最大分配页面数为512个,则可用内存数最大为2^9*4K=2M

### GFP_DMA 与 GFP_ATOMIC 的选择与区别 #### 1. 定义与功能 - **GFP_DMA**:用于分配满足 DMA(直接内存访问)要求的内存。这种标志通常用于需要低地址物理内存的硬件设备,例如某些旧的 PCI 设备或嵌入式系统中的硬件组件[^2]。它确保分配的内存位于特定的内存区域(如 ZONE_DMA 或 ZONE_DMA32),以便硬件能够正确访问。 - **GFP_ATOMIC**:适用于不能阻塞的上下文(如中断处理程序或持有自旋锁时)。在这种情况下,如果内存不足,内核不会等待内存释放,而是立即返回 NULL[^4]。 #### 2. 使用场景 - **GFP_DMA**:当需要为硬件设备分配低地址物理内存时使用。例如,在驱动程序开发中,某些硬件可能无法访问高地址内存,因此必须使用 `GFP_DMA` 来确保分配的内存位于硬件可访问的范围内[^2]。 - **GFP_ATOMIC**:当代码运行在不能睡眠的上下文中时使用,例如中断处理程序、软中断或持有自旋锁时。在这种情况下,使用 `GFP_KERNEL` 会导致调度错误或死锁,因此必须选择 `GFP_ATOMIC`[^4]。 #### 3. 行为差异 - **GFP_DMA**:主要关注内存区域的选择,确保分配的内存符合硬件的 DMA 要求。它的行为与是否可以阻塞无关,但通常会与其他标志结合使用,例如 `GFP_DMA | GFP_KERNEL` 或 `GFP_DMA | GFP_ATOMIC`[^2]。 - **GFP_ATOMIC**:专注于非阻塞分配,不允许调用者进入睡眠状态。即使内存不足,也不会尝试回收内存,而是直接返回失败。因此,使用 `GFP_ATOMIC` 时需要特别注意检查返回值,并准备好处理分配失败的情况[^4]。 #### 4. 内存分配的优先级 - **GFP_DMA**:由于其限制了内存区域,可能导致可用内存较少,尤其是在系统内存紧张的情况下。因此,使用 `GFP_DMA` 时应尽量减少分配大小,以降低分配失败的概率[^2]。 - **GFP_ATOMIC**:由于其不阻塞的特性,分配失败的概率较高。为了提高成功率,可以在关键路径之外预先分配内存,或者使用内存池等技术来管理紧急情况下的内存需求[^4]。 #### 示例代码 以下是一个简单的示例,展示如何根据需求选择 `GFP_DMA` 和 `GFP_ATOMIC`: ```c #include <linux/slab.h> #include <linux/kernel.h> void example_allocation(bool dma_required, bool atomic_context) { void *ptr; if (dma_required && atomic_context) { // 需要 DMA 内存且在原子上下文中 ptr = kmalloc(1024, GFP_DMA | GFP_ATOMIC); } else if (dma_required) { // 需要 DMA 内存且在非原子上下文中 ptr = kmalloc(1024, GFP_DMA | GFP_KERNEL); } else if (atomic_context) { // 不需要 DMA 内存但在原子上下文中 ptr = kmalloc(1024, GFP_ATOMIC); } else { // 不需要 DMA 内存且在非原子上下文中 ptr = kmalloc(1024, GFP_KERNEL); } if (!ptr) { printk(KERN_ERR "Memory allocation failed\n"); return; } // 使用分配的内存 memset(ptr, 0, 1024); // 释放内存 kfree(ptr); } ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值