PyTorch 原生FP8训练进展
GiantPandaCV GiantPandaCV 2025年01月08日 19:57 韩国
博客来源:https://pytorch.org/blog/training-using-float8-fsdp2/ 。by IBM and Meta 。这里主要是汇总一下FSDP2和FP8训练相关的内容,目前的实践主要集中在TorchTitan(DTensor,Async Tensor Parallelism,FP8 Allgather等等)和torchao上面,包括torch.compile编译器也在做对应的支持,PyTorch对于这个工作其实还没做到很稳定,和Meagtron-LM的FP8类似处于半成品阶段,例如API接口变动就很大,这里可以先简单了解一下他们的进展。以下是PyTorch关于FP8训练最新进展的博客翻译。
FSDP2和FP8训练 相关前置内容:

最低0.47元/天 解锁文章
1333

被折叠的 条评论
为什么被折叠?



