目录
一、fp16和fp32介绍
- fp16是指采用2字节(16位)进行编码存储的一种数据类型;同理fp32是指采用4字节(32位);

- 如上图,fp16第一位表示+-符号,接着5位表示指数,最后10位表示分数;
- 公式:

- 其中,sign位表示正负,exponent位表示指数( ),fraction位表示的是分数( )。其中当指数为零的时候,下图加号左边为0,其他情况为1。
- 具体计算情况可分为下面三种:

- Exp:

- 所以可以计算出,fp16值动态区间
:精度其实为
- 公式:
本文介绍了fp16和fp32数据类型的差异,探讨了为何在深度学习中使用fp16进行训练以节省内存和可能的加速效果。同时,文章指出了fp16训练中可能出现的溢出问题及其解决方案,如混合精度加速和损失放大技术。通过在1080Ti GPU上的实践,发现fp16能节省内存但并未观察到明显的计算加速,这需要Volta结构的GPU才能实现TensorCore加速。
目录




:精度其实为