驱动下载
下载地址:https://www.nvidia.cn/geforce/drivers/
安装:https://www.cnblogs.com/fanminhao/p/8902296.html
安装pytorch_gpu
conda install pytorch==1.4.0 torchvision==0.5.0 cudatoolkit=10.1 -c pytorch
torch_scatter
参考:https://www.cnblogs.com/ZeroTensor/p/10930031.html
必须强调一下,一定检查自己的系统版本、显卡、gcc、Linux内核是否支持cuda10.1。下图是支持cuda10.1的系统要求。使用以下指令查询自己的显卡、gcc、Linux内核
$ lspci | grep -i nvidia
$ uname -m && cat / etc / * release
$ gcc --version
$ uname -r
卸载旧Cuda8.0
卸载原来的cuda8.0(注意:不需要卸载显卡驱动,不要给自己找麻烦):
sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
卸载之后,会发现 /usr/local/cuda-8.0目录下任然有文件存在,这是cudnn文件,所以还需要将cuda-8.0文件删除干净:
sudo rm -rf /usr/local/cuda-8.0
安装新Cuda10.0
下载地址:https://developer.nvidia.com/cuda-toolkit-archive
然后执行:
sudo sh cuda_10.1.105_418.39_linux.run
然后用一本书的书角压住回车键,直到服务条款显示到100%。接着按下面的步骤选择:
- accept
- n(不要安装driver)
- y
- y
- y
安装完成后,设置环境变量。
修改环境变量
打开主目录下的 .bashrc文件,将相关路径按下面的格式进行修改。例如我的.bashrc文件在/home/wangyuanwei下,如果没有找到,则按Ctrl+H键显示隐藏文件。
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.1/lib64
export PATH=$PATH:/usr/local/cuda-10.1/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.1
删除旧版本的cudnn
sudo rm -rf /usr/local/cuda/include/cudnn.h
sudo rm -rf /usr/local/cuda/lib64/libcudnn
安装新版本的cudnn
下载所需要的cudnn版本:https://developer.nvidia.com/rdp/cudnn-archive
打开终端找到下载的deb 文件所在的位置,然后按步骤安装三个文件:
sudo dpkg -i libcudnn7_7.6.5.32-1+cuda10.1_amd64.deb
sudo dpkg -i libcudnn7-dev_7.6.5.32-1+cuda10.1_amd64.deb
sudo dpkg -i libcudnn7-doc_7.6.5.32-1+cuda10.1_amd64.deb
安装tgz文件
https://zhouchen.blog.youkuaiyun.com/article/details/107778087
查看当前cudnn的版本
在终端输入:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2