RuntimeError: all tensors must be on devices[0]
该问题由于PyTorch程序设置的gpu_id编号未从0开始导致的。
解决方案,在运行python命令前设置一下CUDA_VISIBLE_DEVICES:
CUDA_VISIBLE_DEVICES=1,2,3 python example.py --gpu_id 0 1 2
注意:在程序中设置gpu_id仍要从0开始,上例中gpu_id 0对应device 1,gpu_id 1对应device 2,gpu_id 2对应device 3
本文介绍了一个常见的PyTorch多GPU编程错误:所有张量必须位于设备[0]上。此问题源于程序中gpu_id编号未从0开始。文章提供了设置CUDA_VISIBLE_DEVICES的解决方案,并解释了如何正确配置程序中的gpu_id。
1万+

被折叠的 条评论
为什么被折叠?



