数与数据类型
大端小端
不管是几进制数,在平时写的时候习惯最左边是最高位,但在机器电路上并不总是这样。先来统一对顺序的描述方式:
- LSB:最低有效位,也就是bit 0
- MSB:最高有效位,32位的就是bit 31
那么用LSB和MSG来描述大端和小端的话就是,地址由低位到高位对应的两种排序:
- 小端:由LSB到MSB
- 大端:由MSG到LSB
数据类型
总共有四种数据类型:integer、floating-point、BCD、SIMD。
integer
整数分为signed和unsigned两种,如果是signed,那么MSB就是符号位。每个数值类型都有自己的取值范围。
在计算机中根本无法判断一个整数是signed还是unsigned,只能在整数的使用中,在该用signed的时候用signed,改用unsigned的时候用做unsigned。
floating-point
现在的计算机浮点数格式都遵循IEEE754标准,在x86/x64体系中有三种浮点数:
- 单精度:s[31] + exponent[30~23] + significand[22~0]
- 双精度:s[63] + exponent[62~52] + significand[51~0]
- 扩展双精度:s[79] + exponent[78~64] + j[63] + significand[62~0]
BCD码
在BCD码中,一个十进制的每一位,使用8位的二进制进行编码。比如十进制数15的BCD码为15H[00000001, 00000101]。
上面这种非压缩的BCD码浪费了一半的空间,在压缩的BCD码中,每个BCD数字用4位表示,此时15的packed BCD表示为[00010101]。
SIMD数据
在SEE系列指令以及AVX指令里处理的数据分为两大类:
- vector与scalar类型的浮点数据
- packed integer数据
这些数据使得SIMD指令能一次性处理多个数据,加大吞吐量。
编程基础
编程中用到的数据的来源有下面几种:
- 寄存器
- 内存
- IO端口