目标:
在2080Ti GPU上,运行PyTorch1.2 GPU版本。
经过确认,PyTorch1.2可以搭配CUDA10.0,而CUDA10.0搭配cuDNN7.6(官网下载页面可以直接看到)。最好别用CUDA10.1,出现过问题。
安装Anaconda,创建一个py3.6的pytorch环境。
具体步骤:
参考这个教程,安装NVIDIA驱动。
注意安装时加上-no-opengl-files
参数,防止登录自循环;下载可以用wget xxx
直接在服务器上下载。安装CUDA10.0
- 到NVIDIA官网,下载CUDA Toolkit 10.0的runfile版本。注意看,官网也提示了安装操作。但不要照做。后面细说。
- 转移到服务器,执行:
sudo sh cuda_xxx.run
- 长按空格跳过说明,Install NVIDIA Accelerated选择no,其他默认或选y。
- 安装完毕,警告是因为刚刚选了个n,没关系。
编辑环境变量:
sudo vim ~/.bashrc
,添加以下三行:export CUDA_HOME=/usr/local/cuda export PATH=$PATH:$CUDA_HOME/bin export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
激活:
source ~/.bashrc
测试:最后看到PASS就成功了!
cd /usr/local/cuda/samples/1_Utilities/deviceQuery sudo make ./deviceQuery
- 安装cuDNN7.6
- NVIDIA官网下载。需要注册。以后可能要下载很多次,可以记住密码。注意对应CUDA10.0版本。我选择
cuDNN Library for Linux
。 - 转移到服务器,
tar xvf cudnnxxx
解压。 执行以下操作:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ sudo chmod a+r /usr/local/cuda/include/cudnn.h sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
查看版本:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
,完成!
- NVIDIA官网下载。需要注册。以后可能要下载很多次,可以记住密码。注意对应CUDA10.0版本。我选择
- 安装Anaconda
- 在官网查看最新版本的链接,在服务器直接
wget xxx
下载。例如wget https://repo.anaconda.com/archive/Anaconda3-2019.07-Linux-x86_64.sh
。或者用迅雷下,很快。 - 安装,一切默认。
- 如果刚刚没有选y激活,那么就手动在命令行激活:
conda init bash
,重新打开terminal。 切换为国内源:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
- 还可以增加Anaconda关于PyTorch的国内源:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
- 创建环境
pt1.2_py3.6
:conda create -n pt1.2_py3.6 python=3.6
激活该环境:
conda activate pt1.2_py3.6
- 在官网查看最新版本的链接,在服务器直接
- 安装PyTorch和Torchvision
- 在该环境下,
conda install pytorch=1.2
,conda install torchvision
即可。
- 在该环境下,