kernel_thread函数简单分析

最新推荐文章于 2025-10-11 09:36:34 发布

最新推荐文章于 2025-10-11 09:36:34 发布 · 552 阅读

本文深入剖析了Linux内核中的kernel_thread函数，详细介绍了该函数如何创建一个新的内核线程，并通过do_fork函数实现线程的生成过程。文章还探讨了线程创建时的最大数量限制及其在系统中的实现。

http://hi.baidu.com/wzt85/blog/item/c1f7b75515bc01c1b645ae17.html

kernel_thread函数的作用是产生一个新的线程

内核线程实际上就是一个共享父进程地址空间的进程,它有自己的系统堆栈.

内核线程和进程都是通过do_fork()函数来产生的，系统中规定的最大进程数与
线程数由fork_init来决定:

[/arch/kernel/process.c/fork_init()]
void __init fork_init(unsigned long mempages)
{
#ifndef __HAVE_ARCH_TASK_STRUCT_ALLOCATOR
#ifndef ARCH_MIN_TASKALIGN
#define ARCH_MIN_TASKALIGN L1_CACHE_BYTES
#endif
/* 在slab高速缓存中建立task_struct结构专用的缓冲区队列 */
task_struct_cachep =
kmem_cache_create("task_struct", sizeof(struct task_struct),
ARCH_MIN_TASKALIGN, SLAB_PANIC, NULL, NULL);
#endif

/*
把默认线程数设置到一个安全值,因为内核中总的线程占用的空间
可能要内存一半还要多.
参数mempages系统中总的物理内存结构大小，它等于mempages/PAGESIZE.
比如我机器的内存是512m，那么在我的系统最多能同时产生线程数为
(512*2^20/2^12) / 2^3 = 512*2^5 = 16384
*/
max_threads = mempages / (8 * THREAD_SIZE / PAGE_SIZE);

/*
* 启动系统的时候至少需要20个线程
*/
if(max_threads < 20)
max_threads = 20;

/*
* 每个进程最多产生max_threads/2,也就是线程总数的一半,在我的机器上为8192.
*/
init_task.signal->rlim[RLIMIT_NPROC].rlim_cur = max_threads/2;
init_task.signal->rlim[RLIMIT_NPROC].rlim_max = max_threads/2;
}

kernel_thread原形在/arch/kernel/process.c中.
(*fn)(void *)为要执行的函数的指针,arg为函数参数，flags为do_fork产生线程时的标志.

int kernel_thread(int (*fn)(void *), void * arg, unsigned long flags)
{
struct pt_regs regs;

memset(&regs, 0, sizeof(regs));

regs.ebx = (unsigned long) fn; /* ebx指向函数地址 */
regs.edx = (unsigned long) arg; /* edx指向参数 */

regs.xds = __USER_DS;
regs.xes = __USER_DS;
regs.orig_eax = -1;
regs.eip = (unsigned long) kernel_thread_helper;
regs.xcs = __KERNEL_CS;
regs.eflags = X86_EFLAGS_IF | X86_EFLAGS_SF | X86_EFLAGS_PF | 0x2;

/* 利用do_fork来产生一个新的线程,共享父进程地址空间,并且不允许调试子进程 */
return do_fork(flags | CLONE_VM | CLONE_UNTRACED, 0, &regs, 0, NULL, NULL);
}

[/arch/i386/kernel/process.c/kernel_thread_helper]

extern void kernel_thread_helper(void); /* 定义成全局变量 */
__asm__(".section .text/n"
".align 4/n"
"kernel_thread_helper:/n/t"
"movl %edx,%eax/n/t"
"pushl %edx/n/t" /* edx指向参数,压入堆栈 */
"call *%ebx/n/t" /* ebx指向函数地址,执行函数 */
"pushl %eax/n/t"
"call do_exit/n" /* 结束线程 */
".previous");

在kernel_thread中调用了do_fork，那么do_fork是怎样转入kernel_thread_helper去执行的呢，继续跟踪下do_fork函数.

[kernel/fork.c/do_fork()]

long do_fork(unsigned long clone_flags,
unsigned long stack_start,
struct pt_regs *regs,
unsigned long stack_size,
int __user *parent_tidptr,
int __user *child_tidptr)
{
....
....
p = copy_process(clone_flags, stack_start, regs, stack_size, parent_tidptr, child_tidptr, pid);
....
....
}

它调用copy_process函数来向子进程拷贝父进程的进程环境和全部寄存器副本.
[kernel/fork.c/do_fork()->copy_process]

static task_t *copy_process(unsigned long clone_flags,
unsigned long stack_start,
struct pt_regs *regs,
unsigned long stack_size,
int __user *parent_tidptr,
int __user *child_tidptr,
int pid)
{
...
...
retval = copy_thread(0, clone_flags, stack_start, stack_size, p, regs);
...
...
}

它又调用copy_thread来拷贝父进程的系统堆栈并做相应的调整.
[/arch/i386/kernel/process.c/copy_thread]:

int copy_thread(int nr, unsigned long clone_flags, unsigned long esp,
unsigned long unused,
struct task_struct * p, struct pt_regs * regs)
{
...
...
p->thread.eip = (unsigned long) ret_from_fork;
}
在这里把ret_from_fork的地址赋值给p->thread.eip,p->thread.eip表示当进程下一次调度时的指令开始地址，
所以当线程创建后被调度时，是从ret_from_fork地址处开始的.

[/arch/i386/kernel/entry.s]

到这里说明，新的线程已经产生了.
ENTRY(ret_from_fork)
pushl %eax
call schedule_tail
GET_THREAD_INFO(%ebp)
popl %eax
jmp syscall_exit

syscall_exit:
...
work_resched:
call schedule
...
当它从ret_from_fork退出时，会从堆栈中弹出原来保存的ip，而ip指向kernel_thread_helper,
至此kernel_thread_helper被调用，它就可以运行我们的指定的函数了.