MMU的通俗
理解
看了两天了MMU,有点眉目,记下来。只说原理,不说具体的寄存器设置。
没有MMU时候,CPU核和外部存储器直接对话。情况是这样的:

有了MMU,CPU核外部存储器只找MMU(就好比:妈,我球鞋拿过来吧?妈,我初中的同学录在哪?这里边“妈”是MMU,“我”是CPU核)。按照上边的例子来说,这个“妈”要说的对象。
对待这样的孩子(
CPU核),这个妈(
MMU)要有两样神器来对付。一是一个记事本(
TLB);二是一个柜子(
Cache)。先说生活中哪些用到的柜子。孩子的球鞋,袜子放到柜子中,这些孩子会每天要。直接去这里边拿给他;而对于“初中的同学录”偶尔才会一次的,放到一个地方。这个地方记在记事本(
TLB)上,当孩子(
CPU核)要的时候,告诉他在哪里,让他去拿。
以上我以生活中的例子时行的通俗理解,也顺便做了一个流程图:

最后来总结一下,加上MMU后看似复杂,但是没有妈(
MMU)的话,对于孩子(
CPU核)来说。找到袜子(
常用数据)和找到“初中的同学录”(
不常用数据)一样的费时。
先有生活中的灵活例子,再有计算机的效仿,用生活中的例子来诠释计算机中的问题理容易理解。
下边用一个开MMU和不开MMU的裸机程序的运行速度来验证一下:
@*************************************************************************
@ File:start.S
@ 功能:启动代码:设置存储控制器,设置页表,启动MMU,
@
@*************************************************************************
.text
.global _start
_start:
ldr sp, =4096 @ 设置栈指针,以下都是C函数,调用前需要设好栈
bl pre_lowlevel_init @ 关闭WATCHDOG,否则CPU会不断重启
bl mem_ctrl_asm_init @ 设置存储控制器(MMU要用这个)
bl create_page_table @ 设置页表
bl mmu_init @ 启动MMUbn
ldr sp, =4096 @ 重设栈指针,指向内部SRAM顶端(使用虚拟地址)
bl main
halt_loop:
b halt_loop
/*
* 关看门狗
*/
pre_lowlevel_init:
/* turn off the watchdog */
#define pWTCON 0x53000000
ldr r0, =pWTCON
mov r1, #0x0
str r1, [r0]
mov pc, lr
/*$: end_of pre_lowlevel_init */
/*
* 存储器控制器初始化函数
*/
#define BWSCON 0x48000000
mem_ctrl_asm_init:
adrl r0, SMRDATA @这13个值的起始存储地址 这里的adrl不能简单的用ldr替代
ldr r1, =BWSCON /* Bus Width Status Controller 存储控制器的13个寄存器的开始地址 */
add r2, r0, #13*4
0:
ldr r3, [r0], #4 @ 读取设置值,并让r0加4
str r3, [r1], #4 @ 将此值写入寄存器,并让r1加4
cmp r2, r0 @ 判断是否设置完所有13个寄存器
bne 0b @ 若没有写成,继续
mov pc, lr
.ltorg
/* the literal pools origin */
SMRDATA:
.word 0x22011110 @ BWSCON
.word 0x00000700 @ BANKCON0
.word 0x00000700 @ BANKCON1
.word 0x00000700 @ BANKCON2
.word 0x00000700 @ BANKCON3
.word 0x00000700 @ BANKCON4
.word 0x00000700 @ BANKCON5
.word 0x00018005 @ BANKCON6
.word 0x00018005 @ BANKCON7
.word 0x008C07A3 @ REFRESH
.word 0x000000B1 @ BANKSIZE
.word 0x00000030 @ MRSRB6
.word 0x00000030 @ MRSRB7
/* end_of mem_ctrl_asm_init*/
/*
* init.c: 进行一些初始化,在Steppingstone中运行
* 它和head.S同属第一部分程序,此时MMU未开启,使用物理地址
*/
/*
* 设置页表
*/
void create_page_table(void)
{
/*
* 用于段描述符的一些宏定义
*/
#define MMU_FULL_ACCESS (3 << 10) /* 访问权限 */
#define MMU_DOMAIN (0 << 5) /* 属于哪个域 */
#define MMU_SPECIAL (1 << 4) /* 必须是1 */
#define MMU_CACHEABLE (1 << 3) /* cacheable */
#define MMU_BUFFERABLE (1 << 2) /* bufferable */
#define MMU_SECTION (2) /* 表示这是段描述符 */
#define MMU_SECDESC (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
MMU_SECTION)
#define MMU_SECDESC_WB (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION)
#define MMU_SECTION_SIZE 0x00100000
unsigned long virtuladdr, physicaladdr;
unsigned long *mmu_tlb_base = (unsigned long *)0x30000000;
/*
* Steppingstone的起始物理地址为0,第一部分程序的起始运行地址也是0,
* 为了在开启MMU后仍能运行第一部分的程序,
* 将0~1M的虚拟地址映射到同样的物理地址
*/
virtuladdr = 0;
physicaladdr = 0;
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
MMU_SECDESC_WB;
/*
* 0x56000000是GPIO寄存器的起始物理地址,
* GPBCON和GPBDAT这两个寄存器的物理地址0x56000010、0x56000014,
* 为了在第二部分程序中能以地址0xA0000010、0xA0000014来操作GPBCON、GPBDAT,
* 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间
*/
virtuladdr = 0xA0000000;
physicaladdr = 0x56000000;
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
MMU_SECDESC;
/*
* SDRAM的物理地址范围是0x30000000~0x33FFFFFF,
* 将虚拟地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF上,
* 总共64M,涉及64个段描述符
*/
virtuladdr = 0xB0000000;
physicaladdr = 0x30000000;
while (virtuladdr < 0xB4000000)
{
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
MMU_SECDESC_WB;
virtuladdr += 0x100000;
physicaladdr += 0x100000;
}
}
/*
* 启动MMU
*/
void mmu_init(void)
{
unsigned long ttb = 0x30000000;
__asm__(
"mov r0, #0\n"
"mcr p15, 0, r0, c7, c7, 0\n" /* 使无效ICaches和DCaches */
"mcr p15, 0, r0, c7, c10, 4\n" /* drain write buffer on v4 */
"mcr p15, 0, r0, c8, c7, 0\n" /* 使无效指令、数据TLB */
"mov r4, %0\n" /* r4 = 页表基址 */
"mcr p15, 0, r4, c2, c0, 0\n" /* 设置页表基址寄存器 */
"mvn r0, #0\n"
"mcr p15, 0, r0, c3, c0, 0\n" /* 域访问控制寄存器设为0xFFFFFFFF,
* 不进行权限检查
*/
/*
* 对于控制寄存器,先读出其值,在这基础上修改感兴趣的位,
* 然后再写入
*/
"mrc p15, 0, r0, c1, c0, 0\n" /* 读出控制寄存器的值 */
/* 控制寄存器的低16位含义为:.RVI ..RS B... .CAM
* R : 表示换出Cache中的条目时使用的算法,
* 0 = Random replacement;1 = Round robin replacement
* V : 表示异常向量表所在的位置,
* 0 = Low addresses = 0x00000000;1 = High addresses = 0xFFFF0000
* I : 0 = 关闭ICaches;1 = 开启ICaches
* R、S : 用来与页表中的描述符一起确定内存的访问权限
* B : 0 = CPU为小字节序;1 = CPU为大字节序
* C : 0 = 关闭DCaches;1 = 开启DCaches
* A : 0 = 数据访问时不进行地址对齐检查;1 = 数据访问时进行地址对齐检查
* M : 0 = 关闭MMU;1 = 开启MMU
*/
/*
* 先清除不需要的位,往下若需要则重新设置它们
*/
/* .RVI ..RS B... .CAM */
"bic r0, r0, #0x3000\n" /* ..11 .... .... .... 清除V、I位 */
"bic r0, r0, #0x0300\n" /* .... ..11 .... .... 清除R、S位 */
"bic r0, r0, #0x0087\n" /* .... .... 1... .111 清除B/C/A/M */
/*
* 设置需要的位
*/
"orr r0, r0, #0x0002\n" /* .... .... .... ..1. 开启对齐检查 */
"orr r0, r0, #0x0004\n" /* .... .... .... .1.. 开启DCaches */
"orr r0, r0, #0x1000\n" /* ...1 .... .... .... 开启ICaches */
"orr r0, r0, #0x0001\n" /* .... .... .... ...1 使能MMU */
"mcr p15, 0, r0, c1, c0, 0\n" /* 将修改的值写入控制寄存器 */
: /* 无输出 */
: "r" (ttb) );
}
/*
* leds.c: 循环点亮4个LED
* 属于第二部分程序,此时MMU已开启,使用虚拟地址
*/
/*
* MMU开过后,物理地址就不能用了 可以替换试试
* 也可以关闭mmu,换成物理地址,感受led速度不同
* 开的MMU时也开了Cache,TLB速度是它们提高的
*/
#define GPBCON (*(volatile unsigned long *)0xA0000010) // 物理地址0x56000010 虚拟地址0xA0000010
#define GPBDAT (*(volatile unsigned long *)0xA0000014) // 物理地址0x56000014 虚拟地址0xA0000014
#define GPB5_out (1<<(5*2))
#define GPB6_out (1<<(6*2))
#define GPB7_out (1<<(7*2))
#define GPB8_out (1<<(8*2))
/*
* wait函数加上“static inline”是有原因的,
* 这样可以使得编译leds.c时,wait嵌入main中,编译结果中只有main一个函数。
* 于是在连接时,main函数的地址就是由连接文件指定的运行时装载地址。
* 而连接文件mmu.lds中,指定了leds.o的运行时装载地址为0xB4004000,
* 这样,head.S中的“ldr pc, =0xB4004000”就是跳去执行main函数。
*/
static inline void wait(volatile unsigned long dly)
{
for(; dly > 0; dly--);
}
int main(void)
{
unsigned long i = 0;
// 将LED1-4对应的GPB5/6/7/8四个引脚设为输出
GPBCON = GPB5_out|GPB6_out|GPB7_out|GPB8_out;
while(1){
wait(3000000);
GPBDAT = (~(i<<5)); // 根据i的值,点亮LED1-4
if(++i == 16)
i = 0;
}
return 0;
}
objs := start.o init.o leds.o
all : mmu.bin
mmu.bin : $(objs)
arm-linux-ld -Ttext 0x00000000 -o mmu_elf $^
arm-linux-objcopy -O binary -S mmu_elf $@
arm-linux-objdump -D -m arm mmu_elf > mmu.dis
%.o:%.c
arm-linux-gcc -g -Wall -O2 -c -o $@ $<
%.o:%.S
arm-linux-gcc -g -Wall -O2 -c -o $@ $<
clean:
rm -f mmu.bin mmu_elf mmu.dis *.o
上边的程序是开启了MMU,改为不开MMU的话要在start.S中
注释掉bl mmu_init @ 启动MMUbn和
leds中GPBCON GPBDAT改为物理地址。
快慢的体现在于wait(3000000);同是一个函数,开不开Cache就不一样了。直观一点的就是LED的变化速度会有明显的不一样。这个MMU Cache估计也只有裸机能实验一下了。有了系统,这就是系统级的东西,应用程度没有权限管理这个了。