运行百度的paddle多卡训练需要依赖nccl,所以需要安装nccl
1. 下载txz安装包
下载链接
https://developer.nvidia.com/nccl/nccl-legacy-downloads
最新版本的下载链接(这里用不上)
https://developer.nvidia.com/nccl/nccl-download
2. 解压nccl压缩包
tar -xvf nccl_2.19.3-1+cuda11.0_x86_64.txz
得到两个文件夹include 和 lib, 如图:

3.将include文件夹下的文件都复制到cuda文件夹下对应的inlcude中去
sudo cp include/* /usr/local/cuda-11.8/include
sudo cp -r lib/* /usr/local/cuda-11.8/lib64
执行
ls /usr/local/cuda-11.8/lib64 | grep nccl
4. 需要删除原有文件,然后重新生成libnccl.so 和 libnccl.so.2这两个文件.
cd /usr/local/cuda-11.8/lib64
sudo rm libnccl.so libnccl.so.2
sudo ln -s libnccl.so.2.19.3 libnccl.so.2
sudo ln -s libnccl.so.2 libnccl.so

被折叠的 条评论
为什么被折叠?



