1.安装openmpi 1.10.7
用了Open MPI来支持多块GPU训练,并优化了显存,使得能以更大的batch size进行训练,batch size对最后的精度真的很重要
a.下载链接,默认安装到/usr/local/下:
cd openmpi-1.10.7
./configure
sudo make -j8
sudo make install
cd -
b.配置环境变量
sudo gedit ~/.bashrc
添加
export PATH=/usr/local/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH
到最后一行
source ~/.bashrc
2.运行代码
a.git clone --recursive https://github.com/ShuangLI59/person_search.git
b.
cd caffe
mkdir build && cd build
sudo cmake .. -DUSE_MPI=ON
sudo make -j8
sudo make install
cd ../..
参考:https://blog.youkuaiyun.com/weixin_36697338/article/details/82918049
本文详细介绍了如何使用OpenMPI 1.10.7版本进行多GPU并行训练,通过优化显存使用,实现了更大batchsize的训练,显著提高了最终模型的精度。文章还提供了详细的安装步骤和环境配置指南,以及如何在Caffe框架中启用MPI支持的具体操作。
1293

被折叠的 条评论
为什么被折叠?



