IEEE 754 是浮点数在计算机中的标准表示方法，其核心结构由三部分组成

原创于 2025-12-17 00:00:00 发布 · 543 阅读

CC 4.0 BY-SA版权

文章标签：

130 篇文章

订阅专栏

122 篇文章

订阅专栏

115 篇文章

订阅专栏

IEEE 754 是浮点数在计算机中的标准表示方法，其核心结构由三部分组成：符号位 $ S $、阶码（指数）$ E $ 和尾数（有效数字）$ b_0b_1\cdots b_{p-1} $。其数值表示形式为：

$(-1)^S \times 2^E \times (1.b_0b_1b_2\cdots b_{p-1})$

其中：

参数	单精度 (32位)	双精度 (64位)	扩充精度 (80位)
总长度	32	64	80
符号位 $ S $	1	1	1
指数长度 $ E $	8	11	15
尾数长度 $ P $	23	52	64
偏移量（Bias）	127	1023	16383
最大指数	+127	+1023	+16383
最小指数	-126	-1022	-16382
数值范围	$10−38∼103810^{-38} \sim 10^{38}$	$10−308∼1030810^{-308} \sim 10^{308}$	$10−4932∼10493210^{-4932} \sim 10^{4932}$

注：最小指数不包括 -127/-1023/-16383，因为全 0 阶码用于表示零和非规格化数。

规格化数（Normalized）
- 阶码既不全 0 也不全 1
- 尾数隐含前导 1 → 实际精度为 $ P+1 $ 位
- 表示范围：$ 1 \leq M < 2 $
- 指数真值 = 阶码 - 偏移量
非规格化数（Denormalized / Subnormal）
- 阶码全为 0
- 尾数无隐含 1，表示非常接近 0 的小数
- 指数固定为 $ -Bias + 1 $（如单精度为 -126）
特殊值
- 阶码全为 1
  - 尾数全 0 → 表示 ±∞（取决于符号位）
  - 尾数非 0 → 表示 NaN（Not a Number）

给定阶码字段 10110011（二进制），即十进制 $ 179 $

因此该浮点数的指数部分为 $ 2^{52} $，结合尾数与符号位可还原完整数值。

IEEE 754 的作用在于统一了浮点数的存储与运算标准，确保跨平台数据兼容性，被现代 CPU、GPU、编译器、编程语言（如 C、Java、Python）广泛支持。
将一个十进制浮点数转换为 IEEE 754 单精度（32位）二进制格式，需按以下步骤进行：

例如：将 13.625 转换为二进制

整数部分 13：
$ 13 \div 2 = 6\cdots1 $
$ 6 \div 2 = 3\cdots0 $
$ 3 \div 2 = 1\cdots1 $
$ 1 \div 2 = 0\cdots1 $ → 反向得 1101
小数部分 0.625：
$ 0.625 \times 2 = 1.25 $ → 取 1
$ 0.25 \times 2 = 0.5 $ → 取 0
$ 0.5 \times 2 = 1.0 $ → 取 1
得 0.101