Linux内核中的Per-CPU变量机制深度解析

荣正青

于 2025-06-06 09:01:28 发布

阅读量276

点赞数 5

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_00060/article/details/148464214

Per-CPU变量是Linux内核中一项重要的特性，它允许内核为每个CPU核心创建变量的独立副本。这种设计在多核处理器系统中特别有用，因为它可以避免CPU之间的竞争条件，减少锁的使用，从而提高系统性能。

内核提供了DEFINE_PER_CPU宏来定义Per-CPU变量：

DEFINE_PER_CPU(int, per_cpu_counter);

这个宏展开后会在特殊的.data..percpu段中创建变量。通过查看编译后的内核映像(vmlinux)，我们可以看到这个段的详细信息：

.data..percpu 00013a58  0000000000000000  0000000001a5c000  00e00000  2**12
              CONTENTS, ALLOC, LOAD, DATA

在内核初始化阶段，setup_per_cpu_areas()函数负责为每个CPU核心设置独立的Per-CPU变量区域。这个过程主要包括：

内核支持两种Per-CPU区域的分配方式：

选择哪种分配器可以通过内核启动参数percpu_alloc来指定。

内核提供了一组安全的API来访问Per-CPU变量：

get_cpu_var(var);  // 获取当前CPU的变量引用
// 操作变量...
put_cpu_var(var);  // 释放引用

这些API的实现确保了在访问Per-CPU变量时不会被抢占，从而保证操作的原子性。

get_cpu_var宏的展开过程如下：

对应的put_cpu_var则会重新启用抢占。

内核使用__per_cpu_offset数组来管理不同CPU的变量偏移：

extern unsigned long __per_cpu_offset[NR_CPUS];

当访问某个CPU的Per-CPU变量时，内核会：

这种设计使得访问任何CPU的Per-CPU变量都非常高效。

Per-CPU变量在Linux内核中有广泛应用，例如：

使用Per-CPU变量带来的主要好处包括：

Per-CPU变量是Linux内核中解决多核同步问题的重要机制。通过为每个CPU维护变量的独立副本，它巧妙地避免了锁竞争，提高了系统性能。理解这一机制对于深入Linux内核开发和性能优化至关重要。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考