YOLOV7 DP可以,但是DDP老是报错怎么办?

最近使用多卡训练YOLOV7,一开始使用的是DP,可以正常训练,但是看到使用DDP可以加速训练,果断使用,但是总报错,之前YOLOV5使用没问题,所以就照着YOLOv5改了改,断断续续改了俩天终于成功了!!!
话不多说,直接上代码:

train.py 最前面加上

LOCAL_RANK = int(os.getenv('LOCAL_RANK', -1))  # https://pytorch.org/docs/stable/elastic/run.html
RANK = int(os.getenv('RANK', -1))
WORLD_SIZE = int(os.getenv('WORLD_SIZE', 1))

在main函数有如下改动

# Set DDP variables
    # opt.world_size = int(os.environ['WORLD_SIZE']) if 'WORLD_SIZE' in os.environ else 1
    # opt.global_rank = int(os.environ['RANK']) if 'RANK' in os.environ else -1
    opt.global_rank = RANK
    opt.local_rank = LOCAL_RANK
    opt.world_size = WORLD_SIZE

我觉得主要原因在于opt.local_rank=int(os.getenv(‘RANK’, -1))这一行!!!

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值