1. 编译到大概33%处,出现Failed to run 'bash ../tools/build_pytorch_libs.sh --use-cuda --use-nnpack nccl caffe2 libshm gloo c10d THD'
解决:最新的pytorch源码编译要求CUDNN>5,升级CUDNN到6.0以上的版本即可。
不需要更改/usr/local/cuda下边的cudnn库,参考以下方法,系统中可安装多个CUDA版本和CUDNN版本的方法。
https://blog.youkuaiyun.com/qq295456059/article/details/78705138
将自己的CUDNN目录加到LD_LIBRARY_PATH中即可,其他需要特定CUDNN版本的软件包编译也可通过此法解决。
2. 以上貌似后续还有问题,没能解决。在74%处还有问题,需要设置其他几个环境变量。
CUDNN_LIBRARY和CUDNN_INCLUDE_DIR,分别设置到自定义cudnn版本处的lib64文件夹和include文件夹。
在终端中设置好像还是有问题,可能是设置方法不对,最后看到编译脚本是py文件,于是尝试在pycharm中运行,Run/Debug Configuration窗口可以设置环境变量。
此外,还可以设置MAX_JOBS环境变量,多线程编译,来加快编译速度。