简单聊聊Deepseek V3的FP8训练

最新推荐文章于 2025-06-18 00:02:07 发布

原创

最新推荐文章于 2025-06-18 00:02:07 发布 · 3.7k 阅读

·

8

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #算法

简单聊聊Deepseek V3的FP8训练

作者企鹅火烈鸟🦩

作者：企鹅火烈鸟🦩

全文约 2400 字，预计阅读时间 6 分钟

引子

Deepseek V3的报告在网上放出之后，在知乎也看了很多训练分析和推理的文章。前段时间也转发了一位大佬的pp分析和通信文章，正好赶上前两天没空。29号凌晨才把文章看完，顺着这股劲儿写一些Deepseek V3里fp8训练。若有错误请大家指正，也希望和大佬们一起讨论。

FP8量化是一种新兴的低精度数值表示方法，通过将FP16或FP32降低到8位浮点数，可以显著减少模型的内存占用(相比FP32降低75%)和计算开销，同时提升推理速度和能效比。它提供E4M3和E5M2两种格式以平衡精度和范围，在保证模型性能的前提下，尤其适合大规模AI模型的训练和部署加速。不过要充分发挥FP8的优势，需要特定硬件支持，如NVIDIA Hopper架构GPU。

整体一览

从Deepseek V3的技术报告里写到，它在Embedding、Attention、gating（MoE路由）、Norm上是用的原始精度（BF16 or FP32，某些gating操作会上FP32吧）。也就是说会做FP8的位置基本就在MoE上的MLP和Attention前后的MLP。

技术报告里讲到，会对FP8训练进行量化。这也是常规操作了，NV的一次OpenDay也讲了关于FP8训练时的量化。

NVIDIA英伟达 - FP8 训练的挑战及最佳实践：https://www.bilibili.com/video/BV1tM4m117eL/

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。