Linux kernel 启动流程分析7---第一阶段打开MMU
一、MMU控制
MMU的配置操作都是通过操作CP15协处理器来实现的。
在ARM架构中,通过CP15协处理器进行MMU的配置时,会用到以下几个重要的寄存器和指令:
-
控制寄存器 (Control Register) -
CP15 c1
- 控制MMU、数据缓存、指令缓存等的启用与禁用。
- 例如,
CP15 c1, c0, c0
控制寄存器通常用来启用或禁用MMU、缓存等。
启用MMU:
-
MCR p15, 0, r0, c1, c0, 0 // 设置控制寄存器,启用MMU
-
系统控制寄存器 -
CP15 c0
- 用于配置系统级的内存管理相关操作,例如页表基地址的设置。
-
页表基地址寄存器 (TTBR)
- TTBR0 (Translation Table Base Register 0):存储第一个页表基地址,通常用于用户空间的地址映射。
- TTBR1 (Translation Table Base Register 1):存储第二个页表基地址,通常用于内核空间的地址映射。
通过写入这些寄存器,系统能够切换不同的页表,进行不同的虚拟地址到物理地址的映射。
设置TTBR寄存器:
-
MCR p15, 0, r0, c2, c0, 0 // 将r0的值(页表基地址)写入TTBR0寄存器
-
域寄存器 (Domain Register) -
CP15 c3
- 用于设置不同内存区域的访问权限。每个域代表一组内存页,域寄存器可以配置每个域的权限(如可读、可写、可执行等)。
设置内存区域权限:
-
MCR p15, 0, r0, c3, c0, 0 // 设置内存访问权限
-
TLB(Translation Lookaside Buffer)
- TLB是MMU用来缓存最近访问的页表项,减少地址转换的延迟。通过CP15可以控制TLB的清除。
- 清除TLB:
-
-
MCR p15, 0, r0, c8, c7, 0 // 清除TLB
-
-
域访问控制寄存器 (DACR)
CP15 c3
寄存器中还可以设置不同的内存访问权限,配置域访问控制(例如,允许某些区域的内存访问,其他区域禁止访问)。
-
MMU启用与禁用
- 启用MMU使得处理器可以将虚拟地址转换为物理地址,并进行内存保护。
- 禁用MMU通常是在内核启动前的早期阶段进行的。
1.1、CP15协处理器寄存器说明
寄存器说明请参考《ARM的CP15协处理器的寄存器》。
表格如下
- 寄存器编号 基本作用 在 MMU 中的作用 在 PU 中的作用
- c0 ID 编码(只读) ID 编码和 cache 类型
- c1 控制位(可读写) 各种控制位
- c2 存储保护和控制 地址转换表基地址 Cachability 的控制位
- c3 存储保护和控制 域访问控制位 Bufferablity 控制位
- c4 存储保护和控制 保留 保留
- c5 存储保护和控制 内存失效状态 访问权限控制位
- c6 存储保护和控制 内存失效地址 保护区域控制
- c7 高速缓存和写缓存 高速缓存和写缓存控制
- c8 存储保护和控制 TLB 控制 保留
- c9 高速缓存和写缓存 高速缓存锁定
- c10 存储保护和控制 TLB 锁定 保留
- c11 保留
重点从MMU的功能方面说明如下几个寄存器
(1)c1,MMU的控制寄存器
bit | 15 | 14 | 13 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
flag | L4 | R | V | I | Z | F | R | S | B | L | D | P | W | C | A | M |
具体意义如下:
- 位 说 明
- M 0:禁止 MMU 或者 PU; 1:使能 MMU 或者 PU
- A 0:禁止地址对齐检查; 1:使能地址对齐检查
- C 0:禁止数据/整个 cache; 1:使能数据/整个 cache
- W 0:禁止写缓冲; 1:使能写缓冲
- P 0:异常中断处理程序进入 32 位地址模式; 1:异常中断处理程序进入 26 位地址模式
- D 0:禁止 26 位地址异常检查; 1:使能 26 位地址异常检查
- L 0:选择早期中止模型; 1:选择后期中止模型
- B 0: little endian; 1: big endian
- S 在基于 MMU 的存储系统中,本位用作系统保护
- R 在基于 MMU 的存储系统中,本位用作 ROM 保护
- F 0:由生产商定义
- Z 0:禁止跳转预测功能; 1:使能跳转预测指令
- I 0:禁止指令 cache; 1:使能指令 cache
- V 0:选择低端异常中断向量 0x0~0x1c; 1:选择高端异常中断向量 0xffff0000~ 0xffff001c
通过上述可知,c1的bit 0位用于控制MMU的开关。
其实这点在《[kernel 启动流程] (第一章)概述》里面也说明过了。
(2)c2,MMU页表基地址存储器
- bit 功能
- 31:0 一级映射描述符表的基地址(物理地址
(3)c3, 定义了 ARM 处理器的 16 个域的访问权限
每两bit定义了一个位域
- bit 31:30 29:28 27:26 25:24 23:22 21:20 19:18 17:16 15:14 13:12 11:10 9:8 7:6 5:4 3:2 1:0
- 位域 D15 D14 D13 D12 D11 D10 D9 D8 D7 D6 D5 D4 D3 D2 D1 D0
其中D0对应DOMAIN_KERNEL,D1对应DOMAIN_USER,D2对应DOMAIN_IO(有可能是反的)
对应权限如下:
#define DOMAIN_NOACCESS 0
#define DOMAIN_CLIENT 1
#ifdef CONFIG_CPU_USE_DOMAINS
#define DOMAIN_MANAGER 3
#else
#define DOMAIN_MANAGER 1
#endif
1.2、打开MMU之前要配置的cp15的寄存器
通过上面1分析,我们知道c1-c10都要进行设置,但我们这里只关注c2和c3
c2,MMU页表基地址存储器
因此,我们需要先将页表物理地址写入到c2寄存器中
c3,定义了 ARM 处理器的 16 个域的访问权限
需要在这个寄存器中写入位域相应的权限,否则可能导致无法访问。
1.3、如何打开MMU
经过前面分析,知道c1作为MMU的控制器,并且其bit0用于控制MMU的开关。
因此,只需要将c1的BIT 0设置为1,就可以打开MMU了。
二、代码分析
2.1、整体入口代码分析
ldr r13, =__mmap_switched @ address to jump to after
@ mmu has been enabled
@ 把__mmap_switched函数的地址放在寄存器
@ __mmap_switched实现了打开MMU之后跳转到start_kernel。
badr lr, 1f @ return (PIC) address
@ 把“b __enable_mmu”这条指令的地址放在lr中
@ 当lr寄存器,简单说,就是存储了调用子程序后返回的指令地址
mov r8, r4 @ set TTBR1 to swapper_pg_dir
@ 把临时内核页表的地址放在r8寄存器中
ldr r12, [r10, #PROCINFO_INITFUNC]
@ 把cpu对应proc info中的__cpu_flush存放到r12寄存器中
@ 通过《[kernel 启动流程] (第三章)第一阶段之——proc info的获取》,
我们知道这个__cpu_flush成员存放的是cpu对应架构的setup函数的地址
@ 对于s5pv210来说,这个值就是__v7_setup的连接地址。
add r12, r12, r10
ret r12
@ 这里实现为跳转到__v7_setup的物理地址上,也就是调用__v7_setup,
具体怎么实现我也看不懂,希望有高人赐教下。
1: b __enable_mmu
@ 跳转到__enable_mmu
至此,我们跳转到__v7_setup中了,并且
r13存放了__mmap_switched的地址
lr存放了“b __enable_mmu”这条指令的地址
__v7_setup实现如下
arch/arm/mm/proc-v7.S
__v7_setup:
adr r0, __v7_setup_stack_ptr
ldr r12, [r0]
add r12, r12, r0 @ the local stack
stmia r12, {r1-r6, lr} @ v7_invalidate_l1 touches r0-r6
bl v7_invalidate_l1
ldmia r12, {r1-r6, lr}
__v7_setup_cont:
and r0, r9, #0xff000000 @ ARM?
teq r0, #0x41000000
bne __errata_finish
and r3, r9, #0x00f00000 @ variant
and r6, r9, #0x0000000f @ revision
orr r6, r6, r3, lsr #20-4 @ combine variant and revision
ubfx r0, r9, #4, #12 @ primary part number
/* Cortex-A8 Errata */
ldr r10, =0x00000c08 @ Cortex-A8 primary part number
teq r0, r10
beq __ca8_errata
/* Cortex-A9 Errata */
ldr r10, =0x00000c09 @ Cortex-A9 primary part number
teq r0, r10
beq __ca9_errata
/* Cortex-A15 Errata */
ldr r10, =0x00000c0f @ Cortex-A15 primary part number
teq r0, r10
beq __ca15_errata
__errata_finish:
mov r10, #0
mcr p15, 0, r10, c7, c5, 0 @ I+BTB cache invalidate
#ifdef CONFIG_MMU
mcr p15, 0, r10, c8, c7, 0 @ invalidate I + D TLBs
v7_ttb_setup r10, r4, r5, r8, r3 @ TTBCR, TTBRx setup
ldr r3, =PRRR @ PRRR
ldr r6, =NMRR @ NMRR
mcr p15, 0, r3, c10, c2, 0 @ write PRRR
mcr p15, 0, r6, c10, c2, 1 @ write NMRR
#endif
dsb @ Complete invalidations
#ifndef CONFIG_ARM_THUMBEE
mrc p15, 0, r0, c0, c1, 0 @ read ID_PFR0 for ThumbEE
and r0, r0, #(0xf << 12) @ ThumbEE enabled field
teq r0, #(1 << 12) @ check if ThumbEE is present
bne 1f
mov r3, #0
mcr p14, 6, r3, c1, c0, 0 @ Initialize TEEHBR to 0
mrc p14, 6, r0, c0, c0, 0 @ load TEECR
orr r0, r0, #1 @ set the 1st bit in order to
mcr p14, 6, r0, c0, c0, 0 @ stop userspace TEEHBR access
1:
#endif
adr r3, v7_crval
ldmia r3, {r3, r6}
ARM_BE8(orr r6, r6, #1 << 25) @ big-endian page tables
#ifdef CONFIG_SWP_EMULATE
orr r3, r3, #(1 << 10) @ set SW bit in "clear"
bic r6, r6, #(1 << 10) @ clear it in "mmuset"
#endif
mrc p15, 0, r0, c1, c0, 0 @ read control register
bic r0, r0, r3 @ clear bits them
orr r0, r0, r6 @ set them
THUMB( orr r0, r0, #1 << 30 ) @ Thumb exceptions
ret lr @ return to head.S:__ret
.align 2
__v7_setup_stack_ptr:
.word PHYS_RELATIVE(__v7_setup_stack, .)
ENDPROC(__v7_setup)
主要是armv7打开MMU前的一些架构性的准备动作,比较复杂,我也看不太懂。
主要关注最后的部分。
mrc p15, 0, r0, c1, c0, 0 @ read control register
@ 通过如上指令,将cp15协处理器的c1寄存器的值读写到r0寄存器中
@ 如前面所说,c1寄存器就是MMU的控制器寄存器
bic r0, r0, r3 @ clear bits them
orr r0, r0, r6 @ set them
THUMB( orr r0, r0, #1 << 30 ) @ Thumb exceptions
@ 根据前面armv7的一些计算结果,清除和设置要写入MMU控制器的值(r0)的某些位。
@ 注意,虽然前面代码没有分析,但是可以确认的是,bit0是被置位为1的,也就enable_mmu bit为1.
@ 这样才能打开MMU功能。
ret lr @ return to head.S:__ret
@ 因为前面在进入__v7_setup之前,设置了badr lr, 1f
@ 1: b __enable_mmu
@ 所以在这里会跳转到__enable_mmu中
至此,r0上已经存放了初步设置完的、准备写入cp15协处理器的c1寄存器的值。
并且跳转到了__enable_mmu中。
后续在__enable_mmu中对r0进行进一步的设置。
2、__enable_mmu代码分析
知道临时内核页表被放到了r4上。
经过前面的分析,知道r0上已经存放了初步设置完的、准备写入cp15协处理器的c1寄存器的值。
这里主要做的动作是:
- 需要先将页表物理地址写入到cp15的c2寄存器中
- 需要在cp15的c3寄存器中写入位域相应的权限
- 配置cp15的c1寄存器,用来控制MMU的相应功能
对应代码如下:
__enable_mmu:
#if defined(CONFIG_ALIGNMENT_TRAP) && __LINUX_ARM_ARCH__ < 6
orr r0, r0, #CR_A
#else
bic r0, r0, #CR_A
#endif
@ 配置MMU的地址对齐检查是否使能,也就是c1的bit 1位,先暂存在r0中。
#ifdef CONFIG_CPU_DCACHE_DISABLE
bic r0, r0, #CR_C
#endif
@ 配置数据/整个 cache是否打开,也就是c1的bit 2位,先暂存在r0中。
#ifdef CONFIG_CPU_BPREDICT_DISABLE
bic r0, r0, #CR_Z
#endif
@ 配置跳转预测功能是否使能,也就是c1的bit 11位,先暂存在r0中。
#ifdef CONFIG_CPU_ICACHE_DISABLE
bic r0, r0, #CR_I
#endif
@ 配置指令 cache是否使能,也就是c1的bit 12位,先暂存在r0中。
#ifdef CONFIG_ARM_LPAE
mcrr p15, 0, r4, r5, c2 @ load TTBR0
#else
mov r5, #DACR_INIT
@ 设置位域权限,先存放到r5中。
mcr p15, 0, r5, c3, c0, 0 @ load domain access register
@ 将位域访问权限写入cp15的c3寄存器中,理由第一节已经说明了
mcr p15, 0, r4, c2, c0, 0 @ load page table pointer
@ 将页表物理地址写入cp15的c2寄存器中,理由第一节已经说明了
#endif
b __turn_mmu_on
@ 跳转到__turn_mmu_on中
ENDPROC(__enable_mmu)
至此,MMU打开前的准备动作已经完成,但是还没有写入MMU的控制寄存器c1,也就是说MMU还没有打开。
最终跳转到__turn_mmu_on中做MMU打开的动作,主要的目标也就是向cp15的c1进行写入。
2.2、__turn_mmu_on代码分析
__turn_mmu_on是真正做MMU打开的动作。打开之后,CPU会把所有地址都当作虚拟地址处理。
但是因为在前面已经对__turn_mmu_on的代码区域进行恒等映射,所以无需担心打开MMU之后程序跑飞的问题。
前面已经说明,r0上已经存放了设置完成、准备写入cp15协处理器的c1寄存器的值。
__turn_mmu_on的主要动作就是向cp15的c1寄存器写入r0上的值。
ENTRY(__turn_mmu_on)
mov r0, r0
instr_sync
@ 前面是一些同步操作,具体还没有完全搞清楚
mcr p15, 0, r0, c1, c0, 0 @ write control reg
@ 这里就是这段代码的核心,也就是把r0的值写入到c1中,这时候,MMU就已经打开了
mrc p15, 0, r3, c0, c0, 0 @ read id reg
instr_sync
mov r3, r3
@ 前面是一些同步操作,具体还没有完全搞清楚
mov r3, r13
ret r3
@ 这里会跳转到__mmap_switched中。
@ 因为前面在代码入口有如下指令“ldr r13, =__mmap_switched”,所以r13存放的是__mmap_switched
@ __mmap_switched主要实现start_kernel的动作,下一篇会说明
__turn_mmu_on_end:
ENDPROC(__turn_mmu_on)
通过上述,MMU已经打开完成,并且跳转到了__mmap_switched中。