ARM——协处理器

ARM存储系统有非常灵活的体系结构,可以适应不同的嵌入式应用系统的需要。ARM存储器系统可以使用简单的平板式地址映射机制(就像一些简单的单片机一样,地址空间的分配方式是固定的,系统中各部分都使用物理地址),也可以使用其他技术提供功能更为强大的存储系统。比如:

 

·  系统可能提供多种类型的存储器件,如FLASH、ROM、SRAM等;

·  Caches技术;

·  写缓存技术(write buffers);

·  虚拟内存和I/O地址映射技术。

 

大多数的系统通过下面的方法之一实现对复杂存储系统的管理。

 

·  使能Cache,缩小处理器和存储系统速度差别,从而提高系统的整体性能。

·  使用内存映射技术实现虚拟空间到物理空间的映射。这种映射机制对嵌入式系统非常重要。通常嵌入式系统程序存放在ROM/FLASH中,这样系统断电后程序能够得到保存。但是通常ROM/FLASH与SDRAM相比,速度慢很多,而且基于ARM的嵌入式系统中通常把异常中断向量表放在RAM中。利用内存映射机制可以满足这种需要。在系统加电时,将ROM/FLASH映射为地址0,这样可以进行一些初始化处理;当这些初始化处理完成后将SDRAM映射为地址0,并把系统程序加载到SDRAM中运行,这样很好地满足嵌入式系统的需要。

·  引入存储保护机制,增强系统的安全性。

·  引入一些机制保证将I/O操作映射成内存操作后,各种I/O操作能够得到正确的结果。在简单存储系统中,不存在这样问题。而当系统引入了Cache和write buffer后,就需要一些特别的措施。

 

在ARM系统中,要实现对存储系统的管理通常是使用协处理器CP15,它通常也被称为系统控制协处理器(System Control Coprocessor)。

 

ARM的存储器系统是由多级构成的,每级都有特定的容量和速度。

 

图15.1显示了存储器的层次结构。

① 寄存器。处理器寄存器组可看作是存储器层次的顶层。这些寄存器被集成在处理器内核中,在系统中提供最快的存储器访问。典型的ARM处理器有多个32位寄存器,其访问时间为ns量级。

图15.1  存储器的层次结构

 

② 紧耦合存储器TCM。为弥补Cache访问的不确定性增加的存储器。TCM是一种快速SDRAM,它紧挨内核,并且保证取指和数据操作的时钟周期数,这一点对一些要求确定行为的实时算法是很重要的。TCM位于存储器地址映射中,可作为快速存储器来访问。

③ 片上Cache存储器的容量在8KB~32KB之间,访问时间大约为10ns。

④ 高性能的ARM结构中,可能存在第二级片外Cache,容量为几百KB,访问时间为几十ns。

⑤ DRAM。主存储器可能是几MB到几十MB的动态存储器,访问时间大约为100ns。

⑥ 后援存储器,通常是硬盘,可能从几百MB到几个GB,访问时间为几十ms。

 

注意

TCM和SRAM在技术上相同,但在结构排列上不同;TCM在片上,而SRAM在板上。

 

15.1  协处理器CP15

ARM处理器支持16个协处理器。在程序执行过程中,每个协处理器忽略属于ARM处理器和其他协处理器的指令。当一个协处理器硬件不能执行属于它的协处理器指令时,将产生一个未定义指令异常中断,在该异常中断处理程序中,可以通过软件模拟该硬件操作。比如,如果系统不包含向量浮点运算器,则可以选择浮点运算软件模拟包来支持向量浮点运算。

 

CP15,即通常所说的系统控制协处理器(System Control Coprocesssor)。它负责完成大部分的存储系统管理。除了CP15外,在具体的各种存储管理机制中可能还会用到其他的一些技术,如在MMU中除CP15外,还使用了页表技术等。

 

在一些没有标准存储管理的系统中,CP15是不存在的。在这种情况下,针对协处理器CP15的操作指令将被视为未定义指令,指令的执行结果不可预知。

 

CP15包含16个32位寄存器,其编号为0~15。实际上对于某些编号的寄存器可能对应多个物理寄存器,在指令中指定特定的标志位来区分这些物理寄存器。这种机制有些类似于ARM中的寄存器,当处于不同的处理器模式时,某些相同编号的寄存器对应于不同的物理寄存器。

 

CP15中的寄存器可能是只读的,也可能是只写的,还有一些是可读可写的。在对协处理器寄存器进行操作时,需要注意以下几个问题。

·  寄存器的访问类型(只读/只写/可读可写)。

·  不同的访问引发的不同功能。

·  相同编号的寄存器是否对应不同的物理寄存器。

·  寄存器的具体作用。

 

15.1.1  CP15寄存器访问指令

通常对协处理器CP15的访问使用以下两种指令。

MCR:将ARM寄存器的值写入CP15寄存器中;

MRC:将CP15寄存器的值写入ARM寄存器中。

 

注意

通过协处理器访问指令CDP、LDC和STC指令对协处理器CP15进行访问将产生不可预知的结果。

其中,CDP为协处理器数据操作指令,这个指令初始化一些与协处理器相关的操作;

LDC为一个或多个字的协处理器数据读取指令,此指令从存储器读取数据到指定的协处理器中;

STC为一个或多个32位字的协处理器数据写入指令,此指令初始化一个协处理器的写操作,从给定的协处理器把数据传送到存储器中。

 

指令MCR和MRC指令访问CP15寄存器使用通用语法。

语法格式为:

 

MCR{<cond>}  p15,<opcode1=0>,<Rd>,<CRn>,<CRm>{,<opcode2>}

MRC{<cond>}  p15,<opcode1=0>,<Rd>,<CRn>,<CRm>{,<opcode2>}

 

其中:

<cond>为指令的执行条件。当<cond>条件域为空时,指令无条件执行;

<opcode1>在标准的MRC指令中,为协处理器的<opcode1>,即操作数1。对于CP15来说,此操作数恒为0,即0b000。当针对CP15的MRC指令中<opcode1>不为0时,指令的操作结果不可预知;

<Rd>为ARM寄存器,在ARM和协处理器交换数据时使用。在MRC指令中作为目的寄存器,在MCR中作为源寄存器。

 

注意

r15不能作为ARM寄存器出现在MRC或MCR指令中,如果r15作为<Rd>出现在这里,那么指令的执行结果不可预知。

 

<CRn>是CP15协处理器指令中用到的主要寄存器。在MRC指令中为源寄存器,在MCR中为目的寄存器。CP15协处理器的寄存器c0、c1、…、c15均可出现在这里。

 

<CRm>是附加的协处理器寄存器,用于区分同一个编号的不同物理寄存器和访问类型。当指令中不需要提供附加信息时,将<CRm>指定为C0,否则指令的操作结果不可预知。

 

<opcode2>提供附加信息,用于区分同一个编号的不同物理寄存器,当指令中没有指定附加信息时,省略<opcode2>或者将其指定为0,否则指令的操作结果不可预知。

 

MCR和MRC指令只能操作在特权模式下,如果处理器运行在用户模式,指令的执行结果不可预知。

注意

在用户模式下,如果要访问系统控制协处理器,通常的做法是由操作系统提供SWI软中断调用来完成系统模式的切换。由于不同型号的ARM处理器对此管理差别很大,所以建议用户在应用时将SWI作为一个独立的模块来管理并向上提供通用接口,以屏蔽不同型号处理器之间的差异。


15.1.2  CP15寄存器介绍

CP15的寄存器列表如表4-1所示。

表4-1  ARM处理器中CP15协处理器的寄存器

寄存器编号

基本作用

在MMU中的作用

在PU中的作用

0

ID编码(只读)

ID编码和cache类型

 

1

控制位(可读写)

各种控制位

 

2

存储保护和控制

地址转换表基地址

Cachability的控制位

3

存储保护和控制

域访问控制位

Bufferablity控制位

4

存储保护和控制

保留

保留

5

存储保护和控制

内存失效状态

访问权限控制位

6

存储保护和控制

内存失效地址

保护区域控制

7

高速缓存和写缓存

高速缓存和写缓存控制

 

8

存储保护和控制

TLB控制

保留

9

高速缓存和写缓存

高速缓存锁定

 

10

存储保护和控制

TLB锁定

保留

11

保留

 

 

12

保留

 

 

13

进程标识符

进程标识符

 

14

保留

 

 

15

因不同设计而异

因不同设计而异

因不同设计而异

  • CP15的寄存器C0

CP15中寄存器C0对应两个标识符寄存器,由访问CP15中的寄存器指令中的<opcode_2>指定要访问哪个具体物理寄存器,<opcode_2>与两个标识符寄存器的对应关系如下所示:

 

opcode_2编码

对应的标识符号寄存器

0b000

主标识符寄存器

0b001

cache类型标识符寄存器

其他

保留

1)主标识符寄存器

访问主标识符寄存器的指令格式如下所示:

mrc p15, 0, r0, c0, c0, 0       ;将主标识符寄存器C0,0的值读到r0中

ARM不同版本体系处理器中主标识符寄存器的编码格式说明如下。

ARM7之后处理器的主标识符寄存器编码格式如下所示:

31             24      23            20      19              16    15              4     3               0

由生产商确定

产品子编号

ARM体系版本号

产品主编号

处理器版本号

 

说    明

位[3: 0]

生产商定义的处理器版本号

位[15: 4]

生产商定义的产品主编号,其中最高4位即位[15:12]可能的取值为0~7但不能是0或7

位[19: 16]

ARM体系的版本号,可能的取值如下:

0x1   ARM体系版本4

0x2   ARM体系版本4T

0x3   ARM体系版本5

0x4   ARM体系版本5T

0x5   ARM体系版本5TE

其他  由ARM公司保留将来使用

位[23: 20]

生产商定义的产品子编号,当产品主编号相同时,使用子编号来区分不同的产品子类,如产品中不同的高速缓存的大小等

位[31: 24]

生产厂商的编号,现在已经定义的有以下值:

0x41  =A  ARM公司

0x44  =D  Digital Equipment公司

0x69  =I   intel公司

ARM7处理器的主标识符寄存器编码格式如下所示:

31             24     23     22                        16           15          4         3          0

由生产商确定

A

产品子编号

产品主编号

处理器版本号

 

说    明

位[3: 0]

生产商定义的处理器版本号

位[15: 4]

生产商定义的产品主编号,其中最高4位即位[15:12]的值为0x7

位[22: 16]

生产商定义的产品子编号,当产品主编号相同时,使用子编号来区分不同的产品子类,如产品中不同的高速缓存的大小等

续表 

说    明

位[23]

ARM7支持下面两种ARM体系的版本号:

0x0   ARM体系版本3

0x1   ARM体系版本4T

位[31: 24]

生产厂商的编号,现在已经定义的有以下值:

0x41  =A  ARM公司

0x44  =D  Digital Equipment公司

0x69  =I   Intel公司

ARM7之前处理器的主标识符寄存器编码格式如下所示:

31           24       23       22                    16            15          4         3           0

由生产商确定

A

产品子编号

产品主编号

处理器版本号

 

说    明

位[3: 0]

生产商定义的处理器版本号

位[15: 4]

生产商定义的产品主编号,其中最高4位即为[15:12]的值为0x7

位[22: 16]

生产商定义的产品子编号,当产品主编号相同时,使用子编号来区分不同的产品子类,如产品中不同的高速缓存的大小等

位[23]

ARM7支持下面两种ARM体系的版本号:

0x0   ARM体系版本3

0x1   ARM体系版本4T

位[31: 24]

生产厂商的编号,现在已经定义的有以下值:

0x41  =A  ARM公司

0x44  =D  Digital Equipment公司

0x69  =I   intel公司

2)cache类型标识符寄存器

访问cache类型标识符寄存器的指令格式如下所示:

mrc p15, 0, r0, c0, c0, 1       ;将cache类型标识符寄存器C0,1的值读到r0中

ARM处理器中cache类型标识符寄存器的编码格式如下所示:

31             29     28           25    24       23             12               11            0

0   0   0

属性字段

S

数据cache相关属性

指令cache相关属性

 

说明

位[28: 25]

指定控制字段位[24: 0]指定的属性之外的cache的其他属性,详见表4-2

位[24]

定义系统中的数据cache和指令cache是分开的还是统一的:

0   系统的数据cache和指令cache是统一的;

1   系统的数据cache和指令cache是分开的

位[23: 12]

定义数据cache的相关属性,如果位[24]为0,本字段定义整个cache的属性

位[31: 24]

定义指令cache的相关属性,如果位[24]为0,本字段定义整个cache的属性

其中控制字段位[28:25]的含义说明如下:

表4-2  cache类型标识符寄存器的控制字段位[28:25]

编    码

cache类型

cache内容清除方法

cache内容锁定方法

0b0000

写通类型

不需要内容清除

不支持内容锁定

0b0001

写回类型

数据块读取

不支持内容锁定

0b0010

写回类型

由寄存器C7定义

不支持内容锁定

0b0110

写回类型

由寄存器C7定义

支持格式A

0b0111

写回类型

由寄存器C7定义

支持格式B

控制字段位[23:12]和控制字段位[11:0]的编码格式相同,含义如下所示:

11      9         8             6         5          3                2            1               0

0    0    0

cache容量

cache相联特性

M

块大小

cache容量字段bits[8: 6]的含义如下所示:

编    码

M=0时含义(单位KB)

M=1时含义(单位KB)

0b000

0.5

0.75

0b001

1

1.5

0b010

2

3

0b011

4

6

0b100

8

12

0b101

16

24

0b110

32

48

0b111

64

96

cache相联特性字段bits[5: 3]的含义如下所示:

编    码

M=0时含义

M=1时含义

0b000

1路相联(直接映射)

没有cache

0b001

2路相联

3路相联

0b010

4路相联

6路相联

0b011

8路相联

12路相联

0b100

16路相联

24路相联

0b101

32路相联

48路相联

0b110

64路相联

96路相联

0b111

128路相联

192路相联

cache块大小字段bits[1: 0]的含义如下所示:

编    码

cache块大小

0b00

2个字(8字节)

0b01

4个字(16字节)

0b10

8个字(32字节)

0b11

16个字(64字节)

  • CP15的寄存器C1

访问主标识符寄存器的指令格式如下所示:

mrc p15, 0, r0, c1, c0{, 0}     ;将CP15的寄存器C1的值读到r0中

mcr p15, 0, r0, c1, c0{, 0}     ;将r0的值写到CP15的寄存器C1中

CP15中的寄存器C1的编码格式及含义说明如下:

31 16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

0

附加

L4

RR

V

I

Z

F

R

S

B

L

D

P

W

C

A

M

 

说    明

M

0:禁止MMU或者PU;1:使能MMU或者PU

A

0:禁止地址对齐检查;1:使能地址对齐检查

C

0:禁止数据/整个cache;1:使能数据/整个cache

W

0:禁止写缓冲;1:使能写缓冲

P

0:异常中断处理程序进入32位地址模式;1:异常中断处理程序进入26位地址模式

D

0:禁止26位地址异常检查;1:使能26位地址异常检查

L

0:选择早期中止模型;1:选择后期中止模型

B

0:little endian;1:big endian

S

在基于MMU的存储系统中,本位用作系统保护

R

在基于MMU的存储系统中,本位用作ROM保护

F

0:由生产商定义

Z

0:禁止跳转预测功能;1:使能跳转预测指令

I

0:禁止指令cache;1:使能指令cache

V

0:选择低端异常中断向量0x0~0x1c;1:选择高端异常中断向量0xffff0000~ 0xffff001c

RR

0:常规的cache淘汰算法,如随机淘汰;1:预测性淘汰算法,如round-robin淘汰算法

L4

0:保持ARMv5以上版本的正常功能;1:将ARMv5以上版本与以前版本处理器兼容,不根据跳转地址的bit[0]进行ARM指令和Thumb状态切换:bit[0]等于0表示ARM指令,等于1表示Thumb指令

附加:

 

  • CP15的寄存器C2

CP15中的寄存器C2保存的是页表的基地址,即一级映射描述符表的基地址。其编码格如下所示:

31                                                                                                     0

一级映射描述符表的基地址(物理地址)

  • CP15的寄存器C3

CP15中的寄存器C3定义了ARM处理器的16个域的访问权限。

31                                                                                                     0

D15

D14

D13

D12

D11

D10

D9

D8

D7

D6

D5

D4

D3

D2

D1

D0

  • CP15的寄存器C5

CP15中的寄存器C5是失效状态寄存器,编码格式如下所示:

31                                                           9        8    7       4     3        0

UNP/SBZP

0

域标识

状态标识

其中,域标识bit[7:4]表示存放引起存储访问失效的存储访问所属的域。

状态标识bit[3:0]表示放引起存储访问失效的存储访问类型,该字段含义如表4-3所示(优先级由上到下递减)。

表4-3  状态标识字段含义

引起访问失效的原因

状态标识

域标识

C6

终端异常(Terminal Exception)

0b0010

无效

生产商定义

中断向量访问异常(Vector Exception)

0b0000

无效

有效

地址对齐

0b00x1

无效

有效

一级页表访问失效

0b1100

无效

有效

二级页表访问失效

0b1110

有效

有效

基于段的地址变换失效

0b0101

无效

有效

基于页的地址变换失效

0b0111

有效

有效

基于段的存储访问中域控制失效

0b1001

有效

有效

基于页的存储访问中域控制失效

0b1101

有效

有效

基于段的存储访问中访问权限控制失效

0b1111

有效

有效

基于页的存储访问中访问权限控制失效

0b0100

有效

有效

基于段的cache预取时外部存储系统失效

0b0110

有效

有效

基于页的cache预取时外部存储系统失效

0b1000

有效

有效

基于段的非cache预取时外部存储系统失效

0b1010

有效

有效

  • CP15中的寄存器C6

CP15中的寄存器C5是失效地址寄存器,编码格式如下所示:

31                                                                                                     0

失效地址(虚拟地址)

  • CP15中的寄存器C7

CP15的C7寄存器用来控制cache和写缓存,它是一个只写寄存器,读操作将产生不可预知的后果。

访问CP15的C7寄存器的指令格式如下所示:

mcr p15, 0, <rd>, <c7>, crm, <opcode_2> ;<rd>、<crm>和<opcode_2>的不同取值组合    实现不同功能

  • CP15中的寄存器C8

CP15的C8寄存器用来控制清除TLB的内容,是只写寄存器,读操作将产生不可预知的后果。

访问CP15的C8寄存器的指令格式如下所示:

mcr p15, 0, <rd>, <c8>, crm, <opcode_2> ;<rd>、<crm>和<opcode_2>的不同取值组合实现不同功能,见第4.2节

  • CP15中的寄存器C9

CP15的C9寄存器用于控制cache内容锁定。

访问CP15的C9寄存器的指令格式如下所示:

mcr p15, 0, <rd>, <c9>, c0, <opcode_2>

mrc p15, 0, <rd>, <c9>, c0, <opcode_2>

如果系统中包含独立的指令cache和数据cache,那么对应于数据cache和指令cache分别有一个独立的cache内容锁定寄存器,<opcode_2>用来选择其中的某个寄存器:

<opcode_2>=1选择指令cache的内容锁定寄存器;

<opcode_2>=0选择数据cache的内容锁定寄存器。

CP15的C9寄存器有A、B两种编码格式。编码格式A如下所示:

31                                       32-W 31-W                                         0

cache组内块序号index

0

其中index表示当下一次发生cache未命中时,将预取的存储块存入cache中该块对应的组中序号为index的cache块中。此时序号为0~index-1的cache块被锁定,当发生cache替换时,从序号为index到ASSOCIATIVITY的块中选择被替换的块。

编码格式B如下所示:

31    30                                          W      W-1                                     0

L

0

cache组内块序号index

 

 

说    明

L=0

当发生cache未命中时,将预取的存储块存入cache中该块对应的组中序号为index的cache块中

续表 

说    明

L=1

如果本次写操作之前L=0,并且index值小于本次写入的index,本次写操作执行的结果不可预知;否则,这时被锁定的cache块包括序号为0~index-1的块,当发生cache替换时,从序号为index到ASSOCIATIVITY的块中选择被替换的块

  • CP15的寄存器C10

CP15的C10寄存器用于控制TLB内容锁定。

访问CP15的C10寄存器的指令格式如下所示:

mcr p15, 0, <rd>, <c10>, c0, <opcode_2>

mrc p15, 0, <rd>, <c10>, c0, <opcode_2>

如果系统中包含独立的指令TLB和数据TLB,那么对应于数据TLB和指令TLB分别有一个独立的TLB内容锁定寄存器,<opcode_2>用来选择其中的某个寄存器:

<opcode_2>=1选择指令TLB的内容锁定寄存器;

<opcode_2>=0选择数据TLB的内容锁定寄存器。

C10寄存器的编码格式如下:

31 30                         32-W       31-W                            32-2W    31-2W     1    0

可被替换的条目起始地址的base

下一个将被替换的条目地址victim

0

P

 

说    明

victim

指定下一次TLB没有命中(所需的地址变换条目没有包含在TLB中)时,从内存页表中读取所需的地址变换条目,并把该地址变换条目保存在TLB中地址victim处

base

指定TLB替换时,所使用的地址范围,从(base)到(TLB中条目数-1);字段victim的值应该包含在该范围内

P

1:写入TLB的地址变换条目不会受使整个TLB无效操作的影响,一直保持有效;0:写入TLB的地址变换条目将会受到使整个TLB无效操作的影响

  • CP15的寄存器C13

C13寄存器用于快速上下文切换FCSE。

访问CP15的C13寄存器的指令格式如下所示:

mcr p15, 0, <rd>, <c13>, c0, 0

mrc p15, 0, <rd>, <c13>, c0, 0

C13寄存器的编码格式如下所示:

31                25       24                                                                     0

PID

0

其中,PID表示当前进程的所在的进程空间块的编号,即当前进程的进程标识符,取值为0~127。

0:MVA(变换后的虚拟地址)= VA(虚拟地址),禁止FCSE(快速上下文切换技术),系统复位后PID=0;

非0:使能FCSE。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值