linux内核-分配PID位图算法

linux内核-分配PID位图算法:
在linux中(kernel/pid.c),提供了一种生成唯一PID的机制,用到一种位图算法。
什么是位图算法:它的特点是生成的是整数,而且是唯一的,限定在某个范围内。

内核既要分配唯一的pid还要对已经分好的pid进行跟踪,内核使用了一个大的位图,其中每个pid由一个比特标识。分配一个空闲的pid,本质上等同于找出位图中第一个值为0的比特,接下来将其置为1,释放时由1置为0.
eg:
假如最多有8个进程,我们用一个能表示8种情况的整数来标识。
0x03(00000011) 说明分配了的pid号是0,1号
0x13(00010011) 说明分配了的pid号是0,1,4号

一般应用中数值范围很大,我们考虑用一个比较大的数来表示,如果用unsigned long,4个字节,只能表示32个。如果还需要更多的进程号,我们可以申请一个连续的地址空间来表示。比如 :unsigned long bitmap[8],可以表示32*8个pid.
首先我们要知道申请的pid号在哪个范围,不同的范围用不同的地址中的数据来表示。求地址时相对于首地址的,所以要提供首地址,具体在哪个地址上的数据,要看pid号是什么。pid号对应于偏移号,即从首个bit开始算,看偏移了几位,偏移数值就是pid号。
第一个地址的偏移号时0-31,第二个地址的偏移号时32-63,第三个地址的偏移号时64-95,第四个地址的偏移号时96-127.
并且0~31 %32都得0,表示首地址,31~63 %32都得1,表示第二个地址,64~95 %32都得2,表示第三个地址,96-127 %32都得3,表示第四个地址。
得出结论:
偏移号/32所得结果时相对于首地址的偏移地址量,得到实际地址和pid了。

PID分配方法的DEMO
#include <stdio.h>

/* max pid, equal to 2^15=32768 */
#define PID_MAX_DEFAULT 0x8000

/* page size = 2^12 = 4K */
#define PAGE_SHIFT 12
#define PAGE_SIZE (1UL << PAGE_SHIFT)

#define BITS_PER_BYTE 8
#define BITS_PER_PAGE (PAGE_SIZE * BITS_PER_BYTE)
#define BITS_PER_PAGE_MASK (BITS_PER_PAGE - 1)

typedef struct pidmap
{
unsigned int nr_free;
char page[PID_MAX_DEFAULT];
} pidmap_t;

static pidmap_t pidmap = { PID_MAX_DEFAULT, {'0'} };

static int last_pid = -1;

static int test_and_set_bit(int offset, void *addr)
{
unsigned long mask = 1UL << (offset & (sizeof(unsigned long) * BITS_PER_BYTE - 1));
unsigned long *p = ((unsigned long*)addr) + (offset >> (sizeof(unsigned long) + 1));
unsigned long old = *p;

*p = old | mask;

return (old & mask) != 0;
}

static void clear_bit(int offset, void *addr)
{
unsigned long mask = 1UL << (offset & (sizeof(unsigned long) * BITS_PER_BYTE - 1));
unsigned long *p = ((unsigned long*)addr) + (offset >> (sizeof(unsigned long) + 1));
unsigned long old = *p;

*p = old & ~mask;
}

static int find_next_zero_bit(void *addr, int size, int offset)
{
unsigned long *p;
unsigned long mask;

while (offset < size)
{
p = ((unsigned long*)addr) + (offset >> (sizeof(unsigned long) + 1));
mask = 1UL << (offset & (sizeof(unsigned long) * BITS_PER_BYTE - 1));

if ((~(*p) & mask))
{
break;
}

++offset;
}

return offset;
}

static int alloc_pidmap()
{
int pid = last_pid + 1;
int offset = pid & BITS_PER_PAGE_MASK;

if (!pidmap.nr_free)
{
return -1;
}

offset = find_next_zero_bit(&pidmap.page, BITS_PER_PAGE, offset);
if (BITS_PER_PAGE != offset && !test_and_set_bit(offset, &pidmap.page))
{
--pidmap.nr_free;
last_pid = offset;
return offset;
}

return -1;
}

static void free_pidmap(int pid)
{
int offset = pid & BITS_PER_PAGE_MASK;

pidmap.nr_free++;
clear_bit(offset, &pidmap.page);
}

int main()
{
int i;
for (i = 0; i < PID_MAX_DEFAULT + 100; ++i)
{
printf("pid = %d\n", alloc_pidmap());
if (!(i % 100))
{
// 到整百时释放一次pid,看回绕的时候是不是都是使用整百的pid
free_pidmap(i);
}
}

return 0;
}


<think>好的,用户让我介绍一下Linux内核调度。我需要先回想一下自己对这个主题的了解。首先,Linux内核的进程调度是一个核心功能,它负责决定哪个进程在何时使用CPU资源。不过,可能用户想了解更详细的内容,比如调度器的发展历史、不同类型的调度器,或者是调度策略之类的。 用户可能对操作系统的调度机制不太熟悉,所以需要从基础开始解释。比如,先说明进程调度的基本概念,然后介绍Linux内核中调度器的发展,比如从O(n)到O(1)调度器,再到现在的完全公平调度器(CFS)。这部分可能需要分点说明,结构清晰。 另外,用户可能关心调度器的工作原理,比如时间片轮转、优先级调度,或者CFS使用的红黑树结构。我需要确保这些技术术语的解释足够易懂,避免使用过于专业的术语而不加解释。 还要考虑到用户可能的实际应用场景,比如系统管理员优化服务器性能,或者开发者编写多线程程序时需要了解调度策略。因此,可能需要提到实时进程和普通进程的不同处理方式,以及调度策略如SCHED_FIFO、SCHED_RR和SCHED_OTHER的区别。 另外,需要检查是否需要提到多核处理器下的负载均衡,或者调度器如何避免饥饿问题。这些都是调度器的重要组成部分,但可能用户没有明确提到,不过作为全面介绍应该涵盖。 还要注意用户可能存在的误区,比如认为调度只是简单地轮流执行进程,而实际上有更复杂的算法和数据结构在背后支持。因此,需要强调CFS的设计理念,比如虚拟运行时间和权重分配,确保公平性。 最后,确保回答结构清晰,分点列出主要部分,比如调度器类型、核心机制、调度策略等,每个部分下再详细展开。同时,使用例子帮助理解,比如交互式进程和批处理进程的不同需求如何被调度器满足。 可能还需要提到当前Linux内核使用的调度器版本,以及相关的配置选项,比如如何调整进程的优先级或选择调度策略。这部分可以增加实用性,帮助用户进一步操作或优化。 总之,需要从基本概念入手,逐步深入,涵盖历史发展、核心机制、调度策略和实际应用,确保回答全面且易于理解。</think>Linux内核调度是操作系统的核心机制之一,负责管理CPU资源的分配与进程执行顺序。以下从调度机制、核心组件和策略三个方面逐步解析: --- ### 一、调度器发展历史 1. **O(n)调度器(Linux 2.4)** - 通过遍历所有进程链表选择优先级最高的任务,时间复杂度为$O(n)$,性能随进程数增加而下降。 2. **O(1)调度器(Linux 2.6)** - 引入优先级队列和时间片轮转,通过位图快速定位任务,时间复杂度优化为$O(1)$。 3. **完全公平调度器(CFS,Linux 2.6.23+)** - 基于红黑树实现,以“虚拟运行时间”衡量进程优先级,确保公平性。 --- ### 二、核心机制 1. **时间片分配** - 每个进程分配时间片(如10ms),超时后触发调度。计算公式: $$ \text{vruntime} = \text{实际运行时间} \times \frac{1024}{\text{进程权重}} $$ - 权重由进程优先级(nice值)决定,范围$[-20, 19]$,数值越小优先级越高。 2. **红黑树结构** - CFS用红黑树管理可运行进程,键值为`vruntime`。最小`vruntime`的进程(最左节点)优先执行。 3. **抢占与上下文切换** - 支持内核抢占:高优先级进程可打断低优先级进程。 - 上下文切换开销约1-10微秒,通过`context_switch()`函数实现寄存器保存与恢复。 --- ### 三、调度策略 1. **普通进程(SCHED_OTHER)** - 默认策略,基于时间片和优先级动态调整。 2. **实时进程** - **SCHED_FIFO**:先进先出,不释放CPU直到主动退出或阻塞。 - **SCHED_RR**:时间片轮转,同一优先级进程轮流执行。 3. **截止时间调度(SCHED_DEADLINE)** - 为任务设定绝对截止时间,优先执行最紧急任务。 --- ### 四、多核与负载均衡 1. **SMP调度** - 每个CPU核心有独立运行队列,避免锁竞争。 - 通过`load_balance()`函数迁移任务,均衡负载。 2. **NUMA优化** - 优先在本地内存节点分配任务,减少跨节点访问延迟。 --- ### 五、实际影响 1. **交互式进程优化** - CFS缩短响应时间,适合桌面环境(如浏览器)。 2. **批处理任务** - 通过调整nice值降低优先级,避免抢占关键进程。 --- ### 六、调试与配置 1. **查看调度信息** ```bash chrt -p <PID> # 查看进程调度策略 ps -eo pid,pri,ni,cmd | head # 显示优先级和nice值 ``` 2. **修改调度策略** ```bash chrt -f -p 99 <PID> # 设置进程为SCHED_FIFO,优先级99 ``` --- ### 总结 Linux内核调度通过动态优先级、公平性算法和多核优化,平衡了响应速度与吞吐量。理解其机制有助于优化系统性能(如调整实时任务优先级)或诊断性能瓶颈(如CPU饥饿问题)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值