字节顺序与整数运算-优快云博客

字节顺序

小端

最低有效字节在最前面

大多数Intel兼容机

0x01234567

地址	…	0x100	0x101	0x102	0x103	…
数据	…	67	45	23	01

大端

最高有效字节在最前面

大多数IBM和Sun Microsystems

网络应用程序发送和接受的数据

0x01234567

地址	…	0x100	0x101	0x102	0x103	…
数据	…	01	23	45	67

双端

可以设置成大端或者小端

移位运算

逻辑移位(>>>, <<<)

左移和右移补0
算术移位(>>, <<)

左移补符号位，右移补0

整数表示

32位机器C语言的整型数据类型的典型取值范围

数据类型	最小值	最大值
char	-128	127
unsigned char	0	255
short [int]	-32768	32767
unsigned short [int]	0	65535
int	-2147483648	2147483647
unsigned [int]	0	4294967295
long [int]	-2147483648	2147483647
unsigned long [int]	0	4294967295
long long [int]	-9223372036854775808	9223372036854775807
unsigned long long [int]	0	18446744073709551615

64位机器C语言的整型数据类型的典型取值范围

数据类型	最小值	最大值
char	-128	127
unsigned char	0	255
short [int]	-32768	32767
unsigned short [int]	0	65535
int	-2147483648	2147483647
unsigned [int]	0	4294967295
long [int]	-9223372036854775808	9223372036854775807
unsigned long [int]	0	18446744073709551615
long long [int]	-9223372036854775808	9223372036854775807
unsigned long long [int]	0	18446744073709551615

无符号数

假设一个整数数据有 $w$ 位，可以将位向量写成 $\overrightarrow{x}$ 表示整个向量，或者写成 $[x_{w-1}, x_{w-2}, …, x_{0}]$ 表示向量中的每一位

二进制转无符号数

B 2 U w (x \to) ≐ \sum i = 0 w - 1 x i 2 i

$B2U_w(\overrightarrow{x}) \doteq \sum^{w-1}_{i=0}{x_i2^i}$

有符号数

原码编码

B 2 S w (x \to) ≐ (- 1) x w - 1 \sum i = 0 w - 2 x i 2 i

$B2S_w(\overrightarrow{x}) \doteq (-1)^{x_{w-1}}\sum^{w-2}_{i=0}{x_i2^i}$

反码编码

B 2 O w (x \to) ≐ - x w - 1 (2 w - 1 - 1) + \sum i = 0 w - 2 x i 2 i

$B2O_w(\overrightarrow{x}) \doteq -x_{w-1}(2^{w-1}-1) + \sum^{w-2}_{i=0}{x_i2^i}$

补码编码

B 2 T w (x \to) ≐ - x w - 1 2 w - 1 + \sum i = 0 w - 2 x i 2 i

$B2T_w(\overrightarrow{x}) \doteq -x_{w-1}2^{w-1} + \sum^{w-2}_{i=0}{x_i2^i}$

最高有效位 $x_{w-1}$ 称为符号位，权重为 $-2^{w-1}$

$B2T_w$ 是一个从长度为 $w$ 的位模式到 $TMin_w$ 和 $TMax_w$ 之间数字的映射，写做

B 2 T w : {0, 1} w \to {- 2 w - 1, \dots, 2 w - 1 - 1}

$B2T_w: \{ 0, 1\}^w \rightarrow \{ -2^{w-1}, …, 2^{w-1}-1 \}$

注意

$|TMin_w| = |TMax_w|+1$
$UMax_w = 2 TMax_w + 1$

有符号数和无符号数转换

无符号数到补码

U 2 T w (x) ≐ B 2 T w (U 2 B w (x)) = {u u - 2 w u < 2 w - 1 u \geq 2 w - 1

$U2T_w(x) \doteq B2T_w(U2B_w(x))= \begin{cases} u & u < 2^{w-1} \\ u-2^w & u \geq 2^{w-1} \end{cases}$

补码到无符号数

T 2 U w (x) ≐ B 2 U w (T 2 B w (x)) = {x + 2 w x x < 0 x \geq 0

$T2U_w(x) \doteq B2U_w(T2B_w(x))= \begin{cases} x + 2^w & x < 0 \\ x & x \geq 0 \end{cases}$

扩展数位

零扩展

无符号数转换为一个更大的数据类型，只需要简单地在表示的开头添加0

B 2 U w + k ([0, . . ., x w - 1, x w - 2, . . ., x 0]) = B 2 U w ([x w - 1, x w - 2, . . ., x 0])

$B2U_{w+k}([0, ..., x_{w-1}, x_{w-2}, ..., x_{0}]) = B2U_w([x_{w-1}, x_{w-2}, ..., x_{0}])$

符号扩展

将一个补码数字转换为一个更大的数据类型，需要添加最高有效位的值的副本

B 2 T w + k ([x w - 1, . . ., x w - 1, x w - 2, . . ., x 0]) = B 2 T w ([x w - 1, x w - 2, . . ., x 0])

$B2T_{w+k}([x_{w-1}, ..., x_{w-1}, x_{w-2}, ..., x_{0}]) = B2T_w([x_{w-1}, x_{w-2}, ..., x_{0}])$

截断数字

无符号数的截断结果

B 2 U k ([x k - 1, x k - 2, . . ., x 0]) = B 2 U w ([x w - 1, x w - 2, . . ., x 0]) mod 2 k

$B2U_{k}([x_{k-1}, x_{k-2}, ..., x_{0}]) = B2U_w([x_{w-1}, x_{w-2}, ..., x_{0}]) \ \text{mod}\ 2 ^k$

有符号数补码的截断结果

B 2 T k ([x k - 1, x k - 2, . . ., x 0]) = U 2 T w (B 2 U w ([x w - 1, x w - 2, . . ., x 0]) mod 2 k)

$B2T_{k}([x_{k-1}, x_{k-2}, ..., x_{0}]) = U2T_w(B2U_w([x_{w-1}, x_{w-2}, ..., x_{0}]) \ \text{mod}\ 2 ^k)$

整数运算

无符号数加法

x + u w y = {x + y x + y - 2 w x + y < 2 w 2 w \leq x + y < 2 w + 1

$x +^u_w y= \begin{cases} x+y & x+y<2^w \\ x + y - 2^w & 2^w \leq x+y < 2^{w+1} \end{cases}$

有符号数补码加法

x + t w y = U 2 T w (T 2 U w (x) + u w T 2 U w (y)) = U 2 T w [(x w - 1 2 w + x + y w - 1 2 w + y) mod 2 w] = U 2 T w [(x + y) mod 2 w] = ⎧ ⎩ ⎨ ⎪ ⎪ x + y - 2 w x + y x + y + 2 w 2 w - 1 \leq x + y - 2 w - 1 \leq x + y < 2 w - 1 x + y < - 2 w - 1 正 溢 出 正 常 负 溢 出

$\begin{align*} x +^t_w y &= U2T_w(T2U_w(x) +^u_w T2U_w(y)) \\ &= U2T_w[(x_{w-1}2^w + x + y_{w-1}2^w + y) \ \text{mod} \ 2^w] \\ &= U2T_w[(x+y) \ \text{mod} \ 2^w] \\ &= \begin{cases} x+y-2^w & 2^{w-1} \leq x+y & 正溢出 \\ x+y & -2^{w-1} \leq x+y < 2^{w-1}& 正常 \\ x+y+2^w & x+y < -2^{w-1} & 负溢出 \\ \end{cases} \end{align*}$

有符号数补码的非

- t w x = {- 2 w - 1 - x x = - 2 w - 1 x > - 2 w - 1

$-^t_w x= \begin{cases} -2^{w-1} & x = -2^{w-1} \\ -x & x > -2^{w-1} \end{cases}$

无符号数乘法

x * u w y = (x \cdot y) mod 2 w

$x *^u_w y = (x \cdot y) \ \text{mod} \ 2^w$

有符号数补码乘法

x * t w y = U 2 T w ((x \cdot y) mod 2 w)

$x *^t_w y = U2T_w((x \cdot y) \ \text{mod} \ 2^w)$

乘以常数

B 2 U w + k ([x w - 1, x w - 2, . . ., x 0, 0, . . ., 0]) = \sum i = 0 w - 1 x i 2 i + k = [\sum i = 0 w - 1 x i 2 i] \cdot 2 k = x \cdot 2 k

$\begin{align*} B2U_{w+k}([x_{w-1}, x_{w-2}, ..., x_{0}, 0, ..., 0]) &= \sum^{w-1}_{i=0}{x_i2^{i+k}} \\ &= [\sum^{w-1}_{i=0}{x_i2^{i}}] \cdot 2^k \\ &= x \cdot 2^k \end{align*}$

对于某个常数 $K$ 的表达式 $x * K$ 生成代码，编译器会将 $K$ 的二进制表示为一组0和1交替的序列 $[(0...0)(1...1)(0...0)(1...1)]$

考虑一组从位位置 $n$ 到位置 $m$ 的连续的1（ $n \geq m$ ），有两种形式来计算

$(x << n) + (x << n-1) + … + (x << m)$
$(x << n+1) - (x << m)$ ，当 $n$ 为最高有效位 $-(x << m)$

除以2的幂

无符号数除以2的幂

B 2 U w - k ([x w - k - 1, x w - k - 2, . . ., x 0]) = \sum i = 0 w - k - 1 x i 2 i = [\sum i = k w - 1 x i 2 i] / 2 k = x / 2 k

$\begin{align*} B2U_{w-k}([x_{w-k-1},x_{w-k-2}, ..., x_{0}]) &= \sum^{w-k-1}_{i=0}{x_i2^{i}} \\ &= [\sum^{w-1}_{i=k}{x_i2^{i}}] / 2^k \\ &= x / 2^k \end{align*}$

有符号数补码除以2的幂

B 2 T w - k (T 2 B w (x) / T 2 B w (2 k)) = \sum i = 0 w - k - 1 x i 2 i + (2 k - 1) / 2 k = [\sum i = k w - 1 x i 2 i] / 2 k + (2 k - 1) / 2 k = (x + 2 k - 1) / 2 k

$\begin{align*} B2T_{w-k}(T2B_w(x) / T2B_w(2^k)) &= \sum^{w-k-1}_{i=0}{x_i2^{i}} + (2^k - 1)/2^k \\ &= [\sum^{w-1}_{i=k}{x_i2^{i}}] / 2^k + (2^k - 1)/2^k \\ &= (x+2^k-1) / 2^k \end{align*}$

浮点数

二进制小数

形如 $b_{m}b_{m-1}b_{m-2}...b_{1}b_{0}.b_{-1}b_{-2}...b_{-n+1}b_{-n}$ 的表示法，其中每个二进制数字或者位， $b_i$ 的取值范围是0和1，则

b = \sum i = - n m b i 2 i

$b=\sum^{m}_{i=-n}{b_i2^i}$
符号.变为了二进制的点，点左边的位的权是2的非负幂，右边是负幂

小数的二进制表示法只能表示那些能够被写成 $x \times 2^y$ 的数，其它值职能被近似

IEEE浮点表示

使用 $V=(-1)^s \times M \times 2^E$ 的形式表示一个数

符号 $s$ 决定这个数是负数（1）还是整数（0）
阶码 $E$ 的作用是对浮点数加权，权重是2的 $E$ 次幂
尾数 $M$ 是一个二进制小数，范围是 $1 \sim 2-\epsilon$ ，或者 $0 \sim 1-\epsilon$

将浮点数的位表示划分为三个字段，分别编码

1位的符号位 $s$ 编码符号 $s$
$k$ 位的阶码字段 $exp=e_{k-1}...e_1e_0$ 编码阶码 $E$
$n$ 位的小数字段 $frac=f_{n-1}...f_{1}f_{0}$ 编码尾数 $M$

值的表示

规格化的值

s	exp	frac
s	非0 && 非全1	frac

阶码 $E=exp-Bias$ ，其中 $exp$ 是无符号数，位表示为 $exp=e_{k-1}...e_1e_0$ ，偏置值 $Bias=2^{k-1}-1$

小数字段 $frac$ 解释为描述小数值 $f$ ，其中 $0 \leq f < 1$ ，其二进制表示为 $0.f_{n-1}f_{n-2}...f_{1}f_{0}$ ，尾数 $M＝1+f$ ，这种方式叫做隐含以1开头的表示， $M$ 的二进制表示为 $1.f_{n-1}f_{n-2}...f_{1}f_{0}$

非规格化的值

s	exp	frac
s	0	frac

阶码值 $E=1-Bias$

尾数 $M＝f$

提供了一种表示0的方法。+0.0的浮点表示的位模式为全0，-0.0的服点表示为符号位为1，其它为0

可以表示非常接近于0.0的数，并且是均匀接近于0.0，叫做逐渐溢出

特殊值
1. 无穷大
s exp frac
s 全1 0

阶码值 $E$ 全为1
尾数 $M$ 全为0
符号 $s$ 为0的时候表示 $+\infty$ ，符号 $s$ 为1的时候表示 $-\infty$

能够表示溢出
1. NaN
s exp frac
s 全1 非0

阶码值 $E$ 全为1
尾数 $M$ 非0
不是一个数

s	exp	frac
s	全1	0

s	exp	frac
s	全1	非0

标准浮点格式

单精度（32=1+8+23）

s	exp	frac
(31:31)	(30:23)	(22:0)

- 双精度（64=1+11+52）

s	exp	frac
(63:63)	(62:52)	(51:0)

舍入

向偶数舍入

四舍六入五成双
向零舍入
向下舍入
向上舍入

浮点运算

浮点加法

可交换

x + f y = y + f x

$x+^fy=y+^fx$

大多浮点数有加法的逆元，无穷和NaN是例外
不可结合
单调性

$a \geq b \to x + a \geq x + b$ $a \geq b \rightarrow x+a \geq x+b$

浮点乘法

可交换
单位元为1.0
不可结合
不可分配
单调性

$a \geq b and c \geq 0 \to x * f a \geq x * f b a \geq b and c \leq 0 \to x * f a \leq x * f b a \neq N a N \to a * f a \geq 0 (1) (2) (3)$ $\begin{align} & a \geq b \ \text{and} \ c \geq 0\rightarrow x *^f a \geq x *^f b \\ & a \geq b \ \text{and} \ c \leq 0\rightarrow x *^f a \leq x *^f b \\ & a \neq NaN \rightarrow a *^f a \geq 0 \end{align}$