分布式训练的项目出现问题:

nprocs=torch.cuda.device_count(),

/python3.7/site-packages/torch/multiprocessing/spawn.py", line 199, in spawn
    return start_processes(fn, args, nprocs, join, daemon, start_method='spawn')

torch/multiprocessing/spawn.py", line 157, in start_processes
    while not context.join():

/torch/multiprocessing/spawn.py", line 118, in join
    raise Exception(msg)

出现上述问题,暂时无法从根源上解决,所以采用仅使用一个gpu的策略:

export CUDA_VISIBLE_DEVICES=0

解除上述限制:

export CUDA_VISIBLE_DEVICES=0,1,2,3

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值