Linux kernel 启动流程分析7

Linux kernel 启动流程分析7---第一阶段打开MMU

一、MMU控制

MMU的配置操作都是通过操作CP15协处理器来实现的。

在ARM架构中,通过CP15协处理器进行MMU的配置时,会用到以下几个重要的寄存器和指令:

  1. 控制寄存器 (Control Register) - CP15 c1

    • 控制MMU、数据缓存、指令缓存等的启用与禁用。
    • 例如,CP15 c1, c0, c0 控制寄存器通常用来启用或禁用MMU、缓存等。

    启用MMU:

  • MCR p15, 0, r0, c1, c0, 0    // 设置控制寄存器,启用MMU
    
  • 系统控制寄存器 - CP15 c0

    • 用于配置系统级的内存管理相关操作,例如页表基地址的设置。
  • 页表基地址寄存器 (TTBR)

    • TTBR0 (Translation Table Base Register 0):存储第一个页表基地址,通常用于用户空间的地址映射。
    • TTBR1 (Translation Table Base Register 1):存储第二个页表基地址,通常用于内核空间的地址映射。

    通过写入这些寄存器,系统能够切换不同的页表,进行不同的虚拟地址到物理地址的映射。

    设置TTBR寄存器:

  • MCR p15, 0, r0, c2, c0, 0    // 将r0的值(页表基地址)写入TTBR0寄存器
    
  • 域寄存器 (Domain Register) - CP15 c3

    • 用于设置不同内存区域的访问权限。每个域代表一组内存页,域寄存器可以配置每个域的权限(如可读、可写、可执行等)。

    设置内存区域权限:

  • MCR p15, 0, r0, c3, c0, 0    // 设置内存访问权限
    
  • TLB(Translation Lookaside Buffer)

    • TLB是MMU用来缓存最近访问的页表项,减少地址转换的延迟。通过CP15可以控制TLB的清除。
    • 清除TLB:
    • MCR p15, 0, r0, c8, c7, 0    // 清除TLB
      
  • 域访问控制寄存器 (DACR)

    • CP15 c3寄存器中还可以设置不同的内存访问权限,配置域访问控制(例如,允许某些区域的内存访问,其他区域禁止访问)。
  • MMU启用与禁用

    • 启用MMU使得处理器可以将虚拟地址转换为物理地址,并进行内存保护。
    • 禁用MMU通常是在内核启动前的早期阶段进行的。

1.1、CP15协处理器寄存器说明

寄存器说明请参考《ARM的CP15协处理器的寄存器》。
表格如下

  • 寄存器编号    基本作用    在 MMU 中的作用    在 PU 中的作用
  • c0    ID 编码(只读)    ID 编码和 cache 类型    
  • c1    控制位(可读写)    各种控制位    
  • c2    存储保护和控制    地址转换表基地址    Cachability 的控制位
  • c3    存储保护和控制    域访问控制位    Bufferablity 控制位
  • c4    存储保护和控制    保留    保留
  • c5    存储保护和控制    内存失效状态    访问权限控制位
  • c6    存储保护和控制    内存失效地址    保护区域控制
  • c7    高速缓存和写缓存    高速缓存和写缓存控制    
  • c8    存储保护和控制    TLB 控制    保留
  • c9    高速缓存和写缓存    高速缓存锁定    
  • c10    存储保护和控制    TLB 锁定    保留
  • c11    保留        

重点从MMU的功能方面说明如下几个寄存器

(1)c1,MMU的控制寄存器

bit1514131211109876543210
flagL4RVIZFRSBLDPWCAM

具体意义如下:

  • 位    说 明
  • M    0:禁止 MMU 或者 PU; 1:使能 MMU 或者 PU
  • A    0:禁止地址对齐检查; 1:使能地址对齐检查
  • C    0:禁止数据/整个 cache; 1:使能数据/整个 cache
  • W    0:禁止写缓冲; 1:使能写缓冲
  • P    0:异常中断处理程序进入 32 位地址模式; 1:异常中断处理程序进入 26 位地址模式
  • D    0:禁止 26 位地址异常检查; 1:使能 26 位地址异常检查
  • L    0:选择早期中止模型; 1:选择后期中止模型
  • B    0: little endian; 1: big endian
  • S    在基于 MMU 的存储系统中,本位用作系统保护
  • R    在基于 MMU 的存储系统中,本位用作 ROM 保护
  • F    0:由生产商定义
  • Z    0:禁止跳转预测功能; 1:使能跳转预测指令
  • I    0:禁止指令 cache; 1:使能指令 cache
  • V    0:选择低端异常中断向量 0x0~0x1c; 1:选择高端异常中断向量 0xffff0000~ 0xffff001c

通过上述可知,c1的bit 0位用于控制MMU的开关。
其实这点在《[kernel 启动流程] (第一章)概述》里面也说明过了。

(2)c2,MMU页表基地址存储器

  • bit    功能
  • 31:0    一级映射描述符表的基地址(物理地址

(3)c3, 定义了 ARM 处理器的 16 个域的访问权限
每两bit定义了一个位域

  • bit    31:30    29:28    27:26    25:24    23:22    21:20    19:18    17:16    15:14    13:12    11:10    9:8    7:6    5:4    3:2    1:0
  • 位域    D15    D14    D13    D12    D11    D10    D9    D8    D7    D6    D5    D4    D3    D2    D1    D0

其中D0对应DOMAIN_KERNEL,D1对应DOMAIN_USER,D2对应DOMAIN_IO(有可能是反的)
对应权限如下:

#define DOMAIN_NOACCESS 0
#define DOMAIN_CLIENT   1
#ifdef CONFIG_CPU_USE_DOMAINS
#define DOMAIN_MANAGER  3
#else
#define DOMAIN_MANAGER  1
#endif


1.2、打开MMU之前要配置的cp15的寄存器

通过上面1分析,我们知道c1-c10都要进行设置,但我们这里只关注c2和c3

    c2,MMU页表基地址存储器
    因此,我们需要先将页表物理地址写入到c2寄存器中

    c3,定义了 ARM 处理器的 16 个域的访问权限
    需要在这个寄存器中写入位域相应的权限,否则可能导致无法访问。

1.3、如何打开MMU

经过前面分析,知道c1作为MMU的控制器,并且其bit0用于控制MMU的开关。
因此,只需要将c1的BIT 0设置为1,就可以打开MMU了。


二、代码分析


2.1、整体入口代码分析

    ldr r13, =__mmap_switched       @ address to jump to after
                        @ mmu has been enabled
@ 把__mmap_switched函数的地址放在寄存器
@ __mmap_switched实现了打开MMU之后跳转到start_kernel。

    badr    lr, 1f              @ return (PIC) address
@ 把“b   __enable_mmu”这条指令的地址放在lr中
@ 当lr寄存器,简单说,就是存储了调用子程序后返回的指令地址

    mov r8, r4              @ set TTBR1 to swapper_pg_dir
@ 把临时内核页表的地址放在r8寄存器中

    ldr r12, [r10, #PROCINFO_INITFUNC]
@ 把cpu对应proc info中的__cpu_flush存放到r12寄存器中

@ 通过《[kernel 启动流程] (第三章)第一阶段之——proc info的获取》,
我们知道这个__cpu_flush成员存放的是cpu对应架构的setup函数的地址
@ 对于s5pv210来说,这个值就是__v7_setup的连接地址。

    add r12, r12, r10
    ret r12
@ 这里实现为跳转到__v7_setup的物理地址上,也就是调用__v7_setup,
具体怎么实现我也看不懂,希望有高人赐教下。

1:  b   __enable_mmu
@ 跳转到__enable_mmu

至此,我们跳转到__v7_setup中了,并且
r13存放了__mmap_switched的地址
lr存放了“b __enable_mmu”这条指令的地址

__v7_setup分析

__v7_setup实现如下
arch/arm/mm/proc-v7.S

__v7_setup:
    adr r0, __v7_setup_stack_ptr
    ldr r12, [r0]
    add r12, r12, r0            @ the local stack
    stmia   r12, {r1-r6, lr}        @ v7_invalidate_l1 touches r0-r6
    bl      v7_invalidate_l1
    ldmia   r12, {r1-r6, lr}

__v7_setup_cont:
    and r0, r9, #0xff000000     @ ARM?
    teq r0, #0x41000000
    bne __errata_finish
    and r3, r9, #0x00f00000     @ variant
    and r6, r9, #0x0000000f     @ revision
    orr r6, r6, r3, lsr #20-4       @ combine variant and revision
    ubfx    r0, r9, #4, #12         @ primary part number

    /* Cortex-A8 Errata */
    ldr r10, =0x00000c08        @ Cortex-A8 primary part number
    teq r0, r10
    beq __ca8_errata

    /* Cortex-A9 Errata */
    ldr r10, =0x00000c09        @ Cortex-A9 primary part number
    teq r0, r10
    beq __ca9_errata

    /* Cortex-A15 Errata */
    ldr r10, =0x00000c0f        @ Cortex-A15 primary part number
    teq r0, r10
    beq __ca15_errata

__errata_finish:
    mov r10, #0
    mcr p15, 0, r10, c7, c5, 0      @ I+BTB cache invalidate
#ifdef CONFIG_MMU
    mcr p15, 0, r10, c8, c7, 0      @ invalidate I + D TLBs
    v7_ttb_setup r10, r4, r5, r8, r3    @ TTBCR, TTBRx setup
    ldr r3, =PRRR           @ PRRR
    ldr r6, =NMRR           @ NMRR
    mcr p15, 0, r3, c10, c2, 0      @ write PRRR
    mcr p15, 0, r6, c10, c2, 1      @ write NMRR
#endif
    dsb                 @ Complete invalidations
#ifndef CONFIG_ARM_THUMBEE
    mrc p15, 0, r0, c0, c1, 0       @ read ID_PFR0 for ThumbEE
    and r0, r0, #(0xf << 12)        @ ThumbEE enabled field
    teq r0, #(1 << 12)          @ check if ThumbEE is present
    bne 1f
    mov r3, #0
    mcr p14, 6, r3, c1, c0, 0       @ Initialize TEEHBR to 0
    mrc p14, 6, r0, c0, c0, 0       @ load TEECR
    orr r0, r0, #1          @ set the 1st bit in order to
    mcr p14, 6, r0, c0, c0, 0       @ stop userspace TEEHBR access
1:
#endif
    adr r3, v7_crval
    ldmia   r3, {r3, r6}
 ARM_BE8(orr    r6, r6, #1 << 25)       @ big-endian page tables
#ifdef CONFIG_SWP_EMULATE
    orr     r3, r3, #(1 << 10)              @ set SW bit in "clear"
    bic     r6, r6, #(1 << 10)              @ clear it in "mmuset"
#endif
    mrc p15, 0, r0, c1, c0, 0       @ read control register
    bic r0, r0, r3          @ clear bits them
    orr r0, r0, r6          @ set them
 THUMB( orr r0, r0, #1 << 30    )   @ Thumb exceptions
    ret lr              @ return to head.S:__ret

    .align  2
__v7_setup_stack_ptr:
    .word   PHYS_RELATIVE(__v7_setup_stack, .)
ENDPROC(__v7_setup)

主要是armv7打开MMU前的一些架构性的准备动作,比较复杂,我也看不太懂。
主要关注最后的部分。

    mrc p15, 0, r0, c1, c0, 0       @ read control register
@ 通过如上指令,将cp15协处理器的c1寄存器的值读写到r0寄存器中
@ 如前面所说,c1寄存器就是MMU的控制器寄存器

    bic r0, r0, r3          @ clear bits them
    orr r0, r0, r6          @ set them
 THUMB( orr r0, r0, #1 << 30    )   @ Thumb exceptions
@ 根据前面armv7的一些计算结果,清除和设置要写入MMU控制器的值(r0)的某些位。
@ 注意,虽然前面代码没有分析,但是可以确认的是,bit0是被置位为1的,也就enable_mmu bit为1.
@ 这样才能打开MMU功能。

    ret lr              @ return to head.S:__ret
@ 因为前面在进入__v7_setup之前,设置了badr   lr, 1f  
@ 1:    b   __enable_mmu
@ 所以在这里会跳转到__enable_mmu中

至此,r0上已经存放了初步设置完的、准备写入cp15协处理器的c1寄存器的值。
并且跳转到了__enable_mmu中。
后续在__enable_mmu中对r0进行进一步的设置。


2、__enable_mmu代码分析

知道临时内核页表被放到了r4上。
经过前面的分析,知道r0上已经存放了初步设置完的、准备写入cp15协处理器的c1寄存器的值。
这里主要做的动作是:

  •     需要先将页表物理地址写入到cp15的c2寄存器中
  •     需要在cp15的c3寄存器中写入位域相应的权限
  •     配置cp15的c1寄存器,用来控制MMU的相应功能

对应代码如下:

__enable_mmu:
#if defined(CONFIG_ALIGNMENT_TRAP) && __LINUX_ARM_ARCH__ < 6
    orr r0, r0, #CR_A
#else
    bic r0, r0, #CR_A
#endif
@ 配置MMU的地址对齐检查是否使能,也就是c1的bit 1位,先暂存在r0中。

#ifdef CONFIG_CPU_DCACHE_DISABLE
    bic r0, r0, #CR_C
#endif
@ 配置数据/整个 cache是否打开,也就是c1的bit 2位,先暂存在r0中。

#ifdef CONFIG_CPU_BPREDICT_DISABLE
    bic r0, r0, #CR_Z
#endif
@ 配置跳转预测功能是否使能,也就是c1的bit 11位,先暂存在r0中。

#ifdef CONFIG_CPU_ICACHE_DISABLE
    bic r0, r0, #CR_I
#endif
@ 配置指令 cache是否使能,也就是c1的bit 12位,先暂存在r0中。

#ifdef CONFIG_ARM_LPAE
    mcrr    p15, 0, r4, r5, c2      @ load TTBR0
#else
    mov r5, #DACR_INIT
@ 设置位域权限,先存放到r5中。

    mcr p15, 0, r5, c3, c0, 0       @ load domain access register
@ 将位域访问权限写入cp15的c3寄存器中,理由第一节已经说明了

    mcr p15, 0, r4, c2, c0, 0       @ load page table pointer
@ 将页表物理地址写入cp15的c2寄存器中,理由第一节已经说明了
#endif

    b   __turn_mmu_on
@ 跳转到__turn_mmu_on中
ENDPROC(__enable_mmu)

至此,MMU打开前的准备动作已经完成,但是还没有写入MMU的控制寄存器c1,也就是说MMU还没有打开。
最终跳转到__turn_mmu_on中做MMU打开的动作,主要的目标也就是向cp15的c1进行写入。


2.2、__turn_mmu_on代码分析

__turn_mmu_on是真正做MMU打开的动作。打开之后,CPU会把所有地址都当作虚拟地址处理。
但是因为在前面已经对__turn_mmu_on的代码区域进行恒等映射,所以无需担心打开MMU之后程序跑飞的问题。

前面已经说明,r0上已经存放了设置完成、准备写入cp15协处理器的c1寄存器的值。
__turn_mmu_on的主要动作就是向cp15的c1寄存器写入r0上的值。

ENTRY(__turn_mmu_on)
    mov r0, r0
    instr_sync
@ 前面是一些同步操作,具体还没有完全搞清楚

    mcr p15, 0, r0, c1, c0, 0       @ write control reg
@ 这里就是这段代码的核心,也就是把r0的值写入到c1中,这时候,MMU就已经打开了

    mrc p15, 0, r3, c0, c0, 0       @ read id reg
    instr_sync
    mov r3, r3
@ 前面是一些同步操作,具体还没有完全搞清楚

    mov r3, r13
    ret r3
@ 这里会跳转到__mmap_switched中。
@ 因为前面在代码入口有如下指令“ldr    r13, =__mmap_switched”,所以r13存放的是__mmap_switched
@ __mmap_switched主要实现start_kernel的动作,下一篇会说明
__turn_mmu_on_end:
ENDPROC(__turn_mmu_on)

通过上述,MMU已经打开完成,并且跳转到了__mmap_switched中。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值