MobileNet 在caffe训练加速方法:多GPU:解决Multi-GPU execution not available - rebuild with USE_NCCL

本文详细介绍了在使用Caffe进行多GPU训练时遇到的错误及其解决方案,包括检查CUDA和GCC版本,安装NCCL库,修改Caffe的makefile.config文件,并重新编译Caffe。通过这些步骤,多GPU训练速度得到了显著提升,从每秒2个batch提高到每秒19个batch。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、直接在如下训练指令后加:--gpu all或者 --gpu 0,1报错

./build/tools/caffe train --solver=examples/myExample/0227_gpu/solver_2acc.prototxt

 

报错内容:Multi-GPU execution not available - rebuild with USE_NCCL

 

2、解决方法:

(1)查看cuda和gcc版本

(cuda版本要求:cuda version>6.0,gcc 版本>=gcc 4.8) 

cuda 版本 
cat /usr/local/cuda/version.txt

查看gcc版本

 

(2)安装NCCL1

cd nccl-master

make CUDA_HOME=/usr/local/cuda-8.0/

sudo make install

sudo ldconfig

 

(3)caffe的makefile.config修改

添加:

USE_NCCL := 1

INCLUDE_DIRS += /home/yanghuiyu/make_cmake/nccl-master/build/include

LIBRARY_DIRS += /home/yanghuiyu/make_cmake/nccl-master/build/lib

 

makefile中要有:

ifeq ($(USE_NCCL), 1)

    LIBRARIES += nccl

    COMMON_FLAGS += -DUSE_NCCL endif

 

(4)caffe重新编译

sudo make clean 

sudo make all -j 

 

3、训练速度效果的提升:提升了10倍左右

1s2个batch ----- 1s19个batch

参考:

https://blog.youkuaiyun.com/jmu201521121021/article/details/78654037

https://blog.youkuaiyun.com/wudi_X/article/details/80012764#commentBox

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值