分布式训练模型保存torch.save()、加载model.load_state_dict问题解析:Missing key(s) in state_dict,Unexpected key()
PyTorch分布式训练模型保存与加载问题解析
于 2022-11-18 15:06:12 首次发布
本文详细探讨了在PyTorch中,一块GPU和多块GPU训练模型时的保存与加载策略。对于多GPU训练的模型,由于参数名带有'module.'前缀,加载时需注意去除该前缀或使用strict=False选项。推荐的保存方法是在分布式训练时使用,以便在加载时不出现 KeyError。

订阅专栏 解锁全文
603

被折叠的 条评论
为什么被折叠?



