说明:针对Ubuntu 18.04 LTS,Nvidia 3080Ti环境
一、环境安装
1、安装GPU 510的驱动(可选)
注意随着驱动版本更新,510驱动可能无法适配最新的CUDA,适配表参考https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
sudo apt install nvidia-driver-510 --fix-missing
· 下面验证安装成功
nvidia-smi
2、安装CUDA 11.3
· https://developer.nvidia.com/cuda-toolkit-archive 选择CUDA11.3后,选择Linux – x86_64 – Ubuntu - 20.04 – deb(network)可以看到如下安装代码,按顺序执行即可
· 注意上面需要根据pytorch对CUDA版本进行选择:查看https://pytorch.org/get-started/locally/找支持的最新CUDA版本,当前为CUDA 11.3
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/3bf863cc.pub
sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /"
sudo apt-get update
sudo apt-get -y install cuda-11-3 # 若不设置-11-3则默认安装当前版本CUDA
· 注意安装驱动部分选择no
· 设置环境变量
vim ~/.bashrc
export PATH=/usr/local/cuda-11.3/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
· 下面验证安装成功
nvcc -V # 显示的CUDA版本高于nvidia-smi命令的CUDA版本即可
python
# >>> import torch
# >>> print(torch.cuda.is_available())
3、安装pytorch
在https://pytorch.org/get-started/locally/选择stable-linux-pip-python-CUDA11.3即可(若在conda安装,设置镜像后需要去掉命令中的 “-c” )
· 注意如果以前安装过cpu版本的,先卸载
pip uninstall torch torchvision torchaudio
二、故障排除:
1、Sub-process /usr/bin/dpkg returned an error code (1)
python和python3的ln连接修改为ubuntu自带的python3.6,参考连接删除错误包
https://phoenixnap.com/kb/fix-sub-process-usr-bin-dpkg-returned-error-code-1
三、卸载
1、Nvidia驱动和CUDA的卸载
https://stackoverflow.com/questions/56431461/how-to-remove-cuda-completely-from-ubuntu
四、参考
https://blog.youkuaiyun.com/qq_43030766/article/details/91513501
4322

被折叠的 条评论
为什么被折叠?



