Linux深入理解进程切换

最新推荐文章于 2025-08-05 19:41:49 发布

5381

最新推荐文章于 2025-08-05 19:41:49 发布

阅读量150

点赞数

CC 4.0 BY-SA版权

文章标签： linux 服务器

本文链接：https://blog.youkuaiyun.com/weixin_45169012/article/details/130359521

文章详细阐述了Linux内核中进程切换的过程，包括prepare_task_switch的准备工作，arch_start_context_switch的体系结构相关操作，以及switch_to函数如何切换寄存器状态和栈。在x86_64和ARM64架构中，分别展示了不同的实现方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

进程切换使用的content_switch 函数位于 Linux 内核源码目录的 kernel/sched/core.c 中，代码如下：
其中参数rq代表当前CPU的执行进程队列，prev,next分别指向进程上下文组成的双向链表的进程描述符。

static __always_inline struct rq *
context_switch(struct rq *rq, struct task_struct *prev,
         struct task_struct *next, struct rq_flags *rf)
{
  prepare_task_switch(rq, prev, next);

  /*
   * For paravirt, this is coupled with an exit in switch_to to
   * combine the page table reload and the switch backend into
   * one hypercall.
   */
  arch_start_context_switch(prev);

  /*
   * kernel -> kernel   lazy + transfer active
   *   user -> kernel   lazy + mmgrab() active
   *
   * kernel ->   user   switch + mmdrop() active
   *   user ->   user   switch
   */
  if (!next->mm) {                                // to kernel
    enter_lazy_tlb(prev->active_mm, next);

    next->active_mm = prev->active_mm;
    if (prev->mm)                           // from user
      mmgrab(prev->active_mm);
    else
      prev->active_mm = NULL;
  } else {                                        // to user
    membarrier_switch_mm(rq, prev->active_mm, next->mm);
    /*
     * sys_membarrier() requires an smp_mb() between setting
     * rq->curr / membarrier_switch_mm() and returning to userspace.
     *
     * The below provides this either through switch_mm(), or in
     * case 'prev->active_mm == next->mm' through
     * finish_task_switch()'s mmdrop().
     */
    switch_mm_irqs_off(prev->active_mm, next->mm, next);

    if (!prev->mm) {                        // from kernel
      /* will mmdrop() in finish_task_switch(). */
      rq->prev_mm = prev->active_mm;
      prev->active_mm = NULL;
    }
  }

  rq->clock_update_flags &= ~(RQCF_ACT_SKIP|RQCF_REQ_SKIP);

  prepare_lock_switch(rq, next, rf);

  /* Here we just switch the register state and the stack. */
  switch_to(prev, next, prev);
  barrier();

  return finish_task_switch(prev);
}

其中调用的函数有:
prepare_task_switch()
该函数在进程切换之前调用，内核会执行与体系结构相关的一些调测指令。上下文切换完成后，必须调用 finish_task_switch，即这两个函数一定是要成对出现的。

arch_start_context_switch()
为不同体系结构下的切换函数提供起点

switch_to()
切换寄存器状态和栈。函数会进一步调用 __switch_to_asm()。
在x86_64的实现中:

ENTRY(__switch_to_asm)
  UNWIND_HINT_FUNC
  /*
   * Save callee-saved registers
   * This must match the order in inactive_task_frame
   */
  pushq  %rbp
  pushq  %rbx
  pushq  %r12
  pushq  %r13
  pushq  %r14
  pushq  %r15

  /* switch stack */
  movq  %rsp, TASK_threadsp(%rdi) // 保存旧进程的栈顶
  movq  TASK_threadsp(%rsi), %rsp // 恢复新进程的栈顶

  /* restore callee-saved registers */
  popq  %r15
  popq  %r14
  popq  %r13
  popq  %r12
  popq  %rbx
  popq  %rbp

  jmp  __switch_to
END(__switch_to_asm)

通过movq实现栈顶的切换
通过call指令压栈RIP寄存器到进程切换前的prev进程内核堆栈；而ret指令出栈存入RIP寄存器的是进程切换之后的next进程的内核堆栈栈顶数据.

在ARM64的实现中:
具体执行过程如下

ENTRY(cpu_switch_to)
  mov  x10, #THREAD_CPU_CONTEXT  // 寄存器x10存放thread.cpu_context偏移，与进程task_struct地址相加后即可获得该进程的cpu_context
  add  x8, x0, x10               // x0与偏移量相加后存入x8，获取旧进程cpu_context的地址
  mov  x9, sp                    // 将栈顶sp存入x9，以备后续保存

  // 保存x19~x28寄存器的值，每条指令执行完毕后x8的值会自动+16，以便保存后续寄存器值
  stp  x19, x20, [x8], #16
  stp  x21, x22, [x8], #16
  stp  x23, x24, [x8], #16
  stp  x25, x26, [x8], #16
  stp  x27, x28, [x8], #16

  stp  x29, x9, [x8], #16        // 保存x29(栈基址)与x9(栈顶sp)
  str  lr, [x8]                  // 保存寄存器LR，该寄存器存放了cpu_switch_to函数的返回地址

  add  x8, x1, x10               // x1与偏移量相加后存入x8，获取新进程cpu_context的地址

  // 恢复x19~x28寄存器的值
  ldp  x19, x20, [x8], #16
  ldp  x21, x22, [x8], #16
  ldp  x23, x24, [x8], #16
  ldp  x25, x26, [x8], #16
  ldp  x27, x28, [x8], #16

  ldp  x29, x9, [x8], #16        // 恢复x29(栈基址)与x9(栈顶sp)
  ldr  lr, [x8]                  // 恢复寄存器LR，这样函数cpu_switch_to返回后就会从新进程上次被中断的位置处继续执行
  mov  sp, x9                    // 从x9处恢复sp的值
  msr  sp_el0, x1                // 将新进程进程task_struct地址放入sp_el0
  ret
ENDPROC(cpu_switch_to)
NOKPROBE(cpu_switch_to)

cpu_switch_to() 有两个参数，分别存放在寄存器 x0 与 x1 中，x0 存放上一个进程的进程描述符的地址，x1 存放下一个进程的进程描述符的地址。

总的执行过程:
1.首先使用prepare_task_switch()进行切换前的准备工作
2.进行进程地址空间的切换，代码如下

if (!next->mm) {                             // 1
    enter_lazy_tlb(prev->active_mm, next);   // 2

    next->active_mm = prev->active_mm;       // 3
    if (prev->mm)                            // 4
        mmgrab(prev->active_mm);
    else                                     // 5
        prev->active_mm = NULL;
} else {                                     // 6
    membarrier_switch_mm(rq, prev->active_mm, next->mm);

    switch_mm_irqs_off(prev->active_mm, next->mm, next);  // 7

    if (!prev->mm) {                         // 8
        rq->prev_mm = prev->active_mm;
        prev->active_mm = NULL;
    }
}

3.调用switch_to()，切换寄存器状态和栈。