罗晓波 + 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000
本周学习了对于进程调度的时机和进程切换,照旧,从一个小实验开始本周的分析和总结,实验环境使用实验楼。
一、实验:跟踪进程调度函数
首先,启动menuOS之后,在schedule()函数处打个断点,来跟踪一下:
进程的调度以及上下文的切换都是发生在__schedule()函数里的。
pick_next_task函数是将进程调度算法都封装在这里面,也就是选择一个进程作为下一个即将要执行的进程。
这个context_switch函数:
2352 if (!mm) {
2353 next->active_mm = oldmm;
2354 atomic_inc(&oldmm->mm_count);
2355 enter_lazy_tlb(oldmm, next);
2356 } else
2357 switch_mm(oldmm, mm, next);
2358
2359 if (!prev->mm) {
2360 prev->active_mm = NULL;
2361 rq->prev_mm = oldmm;
2362 }
这里的mm是指next进程的地址空间,《深入理解Linux内核》一书中提到,当mm为null的时候,也就是当这个next进程实质上是一个内核进程的时候,则将被执行的内核进程用prev进程的地址空间,因为,内核进程没有自己的地址空间。同样,下面一句,当prev->mm为空的时候,context_switch需要将指向prev内存描述符的指针保存到运行队列的prev_mm,然后设置prev->active_mm,也就是置空。
context_switch里面最终还是要调用switch_to执行prev和next之间的进程切换。
#define switch_to(prev, next, last) \
32do { \
33 /* \
34 * Context-switching clobbers all registers, so we clobber \
35 * them explicitly, via unused output variables. \
36 * (EAX and EBP is not listed because EBP is saved/restored \
37 * explicitly for wchan access and EAX is the return value of \
38 * __switch_to()) \
39 */ \
40 unsigned long ebx, ecx, edx, esi, edi; \
41 \
42 asm volatile("pushfl\n\t" /* save flags */ \
43 "pushl %%ebp\n\t" /* save EBP */ \
44 "movl %%esp,%[prev_sp]\n\t" /* save ESP */ \
45 "movl %[next_sp],%%esp\n\t" /* restore ESP */ \
46 "movl $1f,%[prev_ip]\n\t" /* save EIP */ \
47 "pushl %[next_ip]\n\t" /* restore EIP */ \
48 __switch_canary \
49 "jmp __switch_to\n" /* regparm call */ \
50 "1:\t" \
51 "popl %%ebp\n\t" /* restore EBP */ \
52 "popfl\n" /* restore flags */ \
53 \
54 /* output parameters */ \
55 : [prev_sp] "=m" (prev->thread.sp), \
56 [prev_ip] "=m" (prev->thread.ip), \
57 "=a" (last), \
58 \
59 /* clobbered output registers: */ \
60 "=b" (ebx), "=c" (ecx), "=d" (edx), \
61 "=S" (esi), "=D" (edi) \
62 \
63 __switch_canary_oparam \
64 \
65 /* input parameters: */ \
66 : [next_sp] "m" (next->thread.sp), \
67 [next_ip] "m" (next->thread.ip), \
68 \
69 /* regparm parameters for __switch_to(): */ \
70 [prev] "a" (prev), \
71 [next] "d" (next) \
72 \
73 __switch_canary_iparam \
74 \
75 : /* reloaded segment registers */ \
76 "memory"); \
77} while (0)
这个宏首先在保存了ebx,ecx,edx,esi,edi,flags在当前内核堆栈上,然后进行关键的堆栈切换:
首先保存旧的ebp、和flags寄存器到旧进程的内核栈中,将旧进程esp保存到thread_info结构中,用新进程esp填写esp寄存器,此时内核栈已切换,将该(之前的Prev进程)进程恢复执行时的下条地址保存到旧进程的thread中,将新进程的ip值压入到新进程的内核栈中,popl %%ebp\n\t之后,该进程执行,恢复ebp寄存器,恢复flags寄存器。另外,在这里,将next->thread.ip压栈,并跳转到__switch_to执行。__switch_to返回时,会从堆栈弹出一项作为返回地址,由于调用__switch_to时不是通过call指令,而是手工压栈加跳转,所以不会返回到“这里”的标号1处,而是返回到next->thread.ip处。
对于switch_to的内核堆栈图大致如下:
在esp还没改变的时候:
切换ESP之后,在新的next内核堆栈上push next_ip:
经过jmp __switch_to之后,也就是开始执行新的进程next进程了。
二、分析与总结:
我们知道,进程调度的时机有以下三种:中断处理过程(包括时钟中断、I/O中断、系统调用和异常)中,直接调用schedule(),或者返回用户态时根据need_resched标记调用schedule();内核线程可以直接调用schedule()进行进程切换,也可以在中断处理过程中进行调度,也就是说内核线程作为一类的特殊的进程可以主动调度,也可以被动调度;用户态进程无法实现主动调度,仅能通过陷入内核态后的某个时机点进行调度,即在中断处理过程中进行调度。
进程的调度中就涉及到了进程与进程之间的切换,之前在Mykernel中也简要分析过这个过程,在真正的linux内核代码中,我们发现,道理都是一样的。也就是上一部分所描述的那样。