【经典阅读】CSAPP-3.3-程序的机器级表示-数据格式

最新推荐文章于 2024-06-01 18:15:59 发布

原创最新推荐文章于 2024-06-01 18:15:59 发布 · 857 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#CSAPP

操作系统专栏收录该内容

123 篇文章

订阅专栏

本文介绍了x86-64架构下C语言数据类型与对应的内存大小，如int为32位（双字），long为64位（四字），指针同样为64位。汇编指令中，通过后缀b、w、l、q表示字节到四字的传输。此外，讨论了浮点数的单精度和双精度表示，并指出特殊80位浮点格式的非移植性和效率问题。

由于是从16位体系结构扩展成32位的，Intel用术语“字(word)”表示16位数据类型。因此，称32位数为“双字(double words)”，称64位数为“四字(quad words)”.图3-1给出了C语言基本数据类型对应的x86-64表示。标准int值存储为双字(32位)。指针(在此用char*表示)存储为8字节的四字，64位机器本来就预期如此。x86-64中，数据类型long实现为64位，允许表示的值范围较大。本章代码示例中的大部分都使用了指针和long数据类型，所以都是四字操作。x86-64 指令集同样包括完整的针对字节、字和双字的指令。

C声明	Intel数据类型	汇编代码后缀	大小(字节)
char	字节	b	1
short	字	w	2
int	双字	l	4
long	四字	q	8
char*	四字	q	8
float	单精度	s	4
double	双精度	l	8

图3-1 C语言数据类型在x86-64中的大小。在64位机器中，指针长8字节

浮点数主要有两种形式:单精度(4字节)值，对应于C语言数据类型float;双精度(8字节)值，对应于C语言数据类型double。x86家族的微处理器历史上实现过对一种特殊的80位(10字节)浮点格式进行全套的浮点运算(参见家庭作业2.86)。可以在C程序中用声明long double来指定这种格式。不过我们不建议使用这种格式。它不能移植到其他类型的机器上，而且实现的硬件也不如单精度和双精度算术运算的高效。

如图所示，大多数GCC生成的汇编代码指令都有一个字符的后缀，表明操作数的大小。例如，数据传送指令有四个变种: movb(传送字节)、movw(传送字)、movl(传送双字)和movq(传送四字)。后缀‘1'用来表示双字，因为32位数被看成是“长字(longword)”。注意，汇编代码也使用后缀‘1'来表示4字节整数和8字节双精度浮点数。这不会产生歧义，因为浮点数使用的是一组完全不同的指令和寄存器。