3B模型大概占多少存储_3b的模型需要多少资源-优快云博客

本文链接：https://blog.youkuaiyun.com/Listennnn/article/details/148472603

下面将分别针对 FP32、FP16、INT8、INT4 四种精度，展示每个参数占用的字节数、计算公式，以及最终得到的磁盘占用。

先计算所有参数占用的总字节数：

3 × 10⁹（参数） × 4（字节/参数） = 12 × 10⁹ 字节

将字节数转换为 GB：

12 × 10⁹ 字节 ÷ (10⁹ 字节/GB) = 12 GB

结论：FP32 权重文件约 12 GB。

计算总字节数：

3 × 10⁹（参数） × 2（字节/参数） = 6 × 10⁹ 字节

转换为 GB：

6 × 10⁹ 字节 ÷ (10⁹ 字节/GB) = 6 GB

结论：FP16 权重文件约 6 GB。

计算总字节数：

3 × 10⁹（参数） × 1（字节/参数） = 3 × 10⁹ 字节

转换为 GB：

3 × 10⁹ 字节 ÷ (10⁹ 字节/GB) = 3 GB

结论：INT8 权重文件约 3 GB。

计算总字节数：

3 × 10⁹（参数） × 0.5（字节/参数） = 1.5 × 10⁹ 字节

转换为 GB：

1.5 × 10⁹ 字节 ÷ (10⁹ 字节/GB) = 1.5 GB

结论：INT4 权重文件约 1.5 GB。

精度类型	每参数占用	计算公式	总字节数	转换后大小	说明
FP32	4 字节	3 × 10⁹ × 4 = 12 × 10⁹ 字节	12 × 10⁹ 字节	12 GB	单精度浮点，训练常用
FP16	2 字节	3 × 10⁹ × 2 = 6 × 10⁹ 字节	6 × 10⁹ 字节	6 GB	半精度浮点，推理常用
INT8	1 字节	3 × 10⁹ × 1 = 3 × 10⁹ 字节	3 × 10⁹ 字节	3 GB	8 位量化，适合边缘设备
INT4	0.5 字节	3 × 10⁹ × 0.5 = 1.5 × 10⁹ 字节	1.5 × 10⁹ 字节	1.5 GB	4 位量化，存储最小，但可能精度损失更大