第2章数据表示、寻址方式与指令系统

原创已于 2024-09-18 00:47:35 修改 · 1.2k 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#职场和发展

于 2024-04-13 18:45:56 首次发布

计算机系统结构专栏收录该内容

8 篇文章

订阅专栏

本文探讨了计算机中的数据表示与数据结构，包括自定义数据表示（如标识符和数据描述符）、高级数据表示如向量数组和堆栈，以及寻址方式的不同面向。重点介绍了指令系统设计原则，比较了CISC和RISC的发展方向，讨论了浮点数处理和寻址方式优化技术。

2.1 数据表示

2.1.1 数据表示与数据结构

数据表示：能由计算机硬件直接识别和引用的数据类型，表现在它有对这种类型的数据进行操作的指令和运算部件。

数据结构：应用中要用到的各种数据元素或信息单元之间的结构关系

数据结构是通过软件映像，变换成计算机中所具有的数据表示来实现的。

2.1.2 高级数据表示

1 自定义数据表示（填空，简答）

（1）标志符数据表示

类型标志 + 数据值
将数据类型与数据本身直接联系在一起。

主要优点：

简化了指令系统和程序设计
简化了编译程序
便于实现一致性校验
能由硬件自动变换数据类型
支持数据库系统的实现与数据类型无关的要求
为软件调试和应用软件开发提供了支持

两个问题：

每个数据字因增设标志符，会增加程序所占的主存空间
采用标志符会降低指令的执行速度

（2）数据描述符

数据描述符是与数据分开存放，用于描述所要访问的数据是整块的还是单个的，访问该数据块或数据元素所要的地址以及其他信息等。主要用于向量、数组、记录等数据。

描述符
101   各种标志位  长度  地址
数据
000  数据

数据描述符与标志符数据表示的差别(简答)

标志符是和每个数据相连的，合存在一个存储单元中，描述单个数据的类型特征；
数据描述符则是与数据分开存放，用于描述所要访问的数据是整块的还是单个的，访问该数据块或数据元素所要的地址以及其他信息等。

2 向量、数组数据表示

增设向量、数组数据表示，组成向量机

引入向量、数组数据表示不止能加快形成元素地址，更重要的是便于实现把向量各元素成块预取到中央处理机，用一条向量、数组指令流水或同时对整个向量、数组高速处理。用硬件判断下标是否越界，并让越界判断和元素运算并行。

3 堆栈数据表示

有堆栈数据表示的计算机称为堆栈计算机

堆栈计算机表现于：

由高速寄存器组成的硬件堆栈，并附加控制电路，让它与主存中的堆栈区在逻辑上构成整体，使堆栈的访问速度是寄存器的，容量是主存的
有丰富的堆栈操作指令且且功能很强，可直接对堆栈中的数据进行各种运算和处理
有力地支持了高级语言程序的编译
有力地支持了子程序的嵌套和递归调用。子程序调用另一子程序称嵌套调用，子程序直接或经子程序间接调用自己称直接或间接递归调用。

2.1.3 引入数据表示的原则

原则1：看系统的效率是否有显著提高，包括实现时间和存储空间是否有显著减少

原则2：看引入这种数据表示后，其通用性和利用率是否提高

2.1.4 浮点数尾数基值大小和下溢处理方法的选择

1 浮点数尾数基值的选择

请添加图片描述

数符：最前面的+或者-，表示这个数的正负
阶符：阶码的正负
阶码p：浮点数尾数的总数位(小数点后有几位阶码就是多少)，尾数右移一个数位则加1，大多题目中，p其实代表的是阶值的位数(bit数),实际的阶码是阶符|阶值,也就是p+1位
尾数：m个机器位
m:计算机位数，比如8位计算机则为8

请添加图片描述

浮点数阶值的位数p主要影响两个可表示区的大小，即可表示数的范围大小，而尾数的位数m主要影响在可表示区中能表示值的精度。由于计算机中尾数位数限制，实数难以精确表示，因此，不得不用较为接近的可表示数来近似表示，产生的误差大小就是数的表示精度。

rm: 浮点数尾数的基值，比如2、4、8、10、16等（几进制就是几）

m’:浮点数尾数的计算机位数， m’=m/log₂ rm，表示一个计算机字能存几个基值

如在二进制下，1.0010101 * 2 ¹⁰⁰,rm为2，阶值为100，m和计算机相关，log₂ rm为 1，若m为8，m’为8

如在十进制下，18.625，rm为10，log₂ rm为4，若m为8，m’为2

请添加图片描述

以 p=2,m=16,rm=4为例，可计算出m’=m/log₂rm=16/2=8

可表示最小尾数值：由于小数点后第一位必为1，那么小数点后只有一位rm就是最小(剩下的都是0)，同时，我们要在基值的所有取值中取最小，最终得rm^-1,如本例中，最小即为4进制的0.1000 0000，而4进制(可取为0,1,2,3,但是第一位不可取0)的最小为1，转为10进制即为1/4
可表示的最大尾数值：小数点后的每一位都取最大（每一位对应基值的可选取值选最大），即为最大，如本例中即为4进制的0.3333 3333,每一位我们都取3;观察得到，最后一位加1就可以进位到小数点前面得到1，最后一位为1是rm^-m’，所以答案是1-rm^-m’,答案也就是1-4^-8
最大阶值：p代表实际阶值的位数，阶值是以2进制存储的，所以最大就是2^p-1，答案也就是3
可表示最小值：最小值时，实际阶值为0，rm的实际阶值次方为1，乘以最小尾数，即rm^-1，本例答案也就是1/4
可表示最大值：rm的最大实际阶值次方乘以最大尾数，所以就是rm^{(2p(2的p次方)-1)}.(1-rm^-m’)，本例答案也就是64 . (1-4^-8)
可表示的尾数个数：尾数中每一位可以有rm种组合(0,1,2,…rm-1)，一共有m’位，但是第一位不能取0，所以第一位只有(rm-1）种取法，所以可表示的尾数个数为rm^(m’-1) . (rm-1),本例答案也就是4⁷ . 3
可表示的阶的个数：p代表实际阶值的位数，所以一共有2^p种取法,本例答案也就是4
可表示数的个数：可表示的尾数个数乘以可表示的阶的个数，即2^p . rm^(m’-1) . (rm-1)，本例答案也就是4⁸ . 3

得到的结论：

可表示数的范围：基值越大，可表示数的范围越大
可表示数的个数：基值越大，可表示数的个数越多
数在数轴上的分布：基值越大，数轴上分布越稀
可表示的精度：基值越大，精度越低
运算中的精度损失：基值越大，精度的损失越小
运算速度：基值越大，运算速度越高

2 浮点数尾数的下溢处理方法

截断法：将尾数超出计算机字长的部分截去。优点实现最简单，不增加硬件，不需要处理时间，不需要处理时间；缺点最大误差较大，平均误差大且无法调节
舍入法：规定字长外增加一位附加位，下溢处理时附加位加1。优点实现简单，增加的硬件很少，最大误差小，平均误差接近于0；缺点处理速度慢
恒置1法：最低位恒置为1。优点实现最简单，平均误差接近0，不增加硬件，不需要处理时间，缺点最大误差最大，比截断法还大
查表舍入法：用ROM或PLA存放下溢处理表，处理时查表。速度快，平均误差可调节到0.缺点是硬件投入大。

2.2 寻址方式

定义：指令按什么方式寻找（或访问）到所需的操作数或信息的。

2.2.1 寻址方式的三种面向

面向主存的寻址：面向主存的寻址主要访问主存，少量访问寄存器
面向寄存器的寻址：主要访问寄存器，少量访问主存和堆栈
面向堆栈的寻址：主要访问堆栈，少量访问主存和寄存器

2.2.2 寻址方式在指令中的指明

占用操作码中的某些位来指明
不占用操作码，而是在地址码部分专门设置寻址方式位字段指明

2.2.3 程序在主存中的定位技术

逻辑地址：程序员编程用的地址
主存物理地址：程序在主存中的实际地址

定位技术有

静态再定位：在目的程序装入主存时，由装入程序用软件方法把目的程序的逻辑地址变换成物理地址，程序执行时，物理地址不再改变，称这种定位技术为静态再定位
动态再定位：在执行每条指令时才形成访存物理地址的方法称为动态再定位
- 变址寻址：是对诸如向量、数组等数据块运算的支持，以便于实现程序的循环
- 基址寻址：是对逻辑地址空间到物理地址空间变换的支持，以利于实现程序的动态再定位
虚实地址映像表：查表映射