1.在安装CUDNN的时候,通过官方文档的教程进行安装,不要使用conda暗账
2.PaddlePaddle的分布式训练需要依赖libnccl.so如果没有安装nccl的话,则会受到下面的报错提示:
Failed to find dynamic library: libnccl.so ( libnccl.so: cannot open shared object file: No such file or directory )
此时,我们可以这个可参考下面的教程完成nccl的安装:
https://blog.youkuaiyun.com/Mr_try/article/details/105267971