运行BEiT相关代码,出现没有init_process错误,但确实各个组件都init了。

一开始以为是没有torch.distributed.init_process_group(),加上代码以后仍报错。查资料发现是多进程在1GPU上运行时,model中的nn.SyncBatchNorm不能正常运行,把nn.SyncBatchNorm改成nn.BatchNorm2d就可以了。

运行BEiT相关代码,出现没有init_process错误,但确实各个组件都init了。

一开始以为是没有torch.distributed.init_process_group(),加上代码以后仍报错。查资料发现是多进程在1GPU上运行时,model中的nn.SyncBatchNorm不能正常运行,把nn.SyncBatchNorm改成nn.BatchNorm2d就可以了。

您可能感兴趣的与本文相关的镜像
PyTorch 2.8
PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理
2086

被折叠的 条评论
为什么被折叠?