前言
最近尝到了租云服务器跑代码的甜头。另一方面,看着自己手头的单卡4090工作站时常崩溃,只能默默叹息。于是乎,我决定按照云服务器的系统和环境重新配置它:配置Ubuntu 22.04服务器版本+nvidia驱动 560.35.03 + Cuda 11.8
本篇是第三部分
第一部分进行了ubuntu系统的安装
第二部分进行了nvidia kernel的升级和nvidia6.8驱动的安装
参考攻略
安装miniconda
- 下载并安装miniconda
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
chmod +x Miniconda3-latest-Linux-x86_64.sh
./Miniconda3-latest-Linux-x86_64.sh
如果wget速度太慢,可以多开几个terminal,同时下载,总有一个速度快,其他的都删掉就好
安装过程中,完全按照操作指导,选择yes和enter和yes即可,安装后重启服务器
sudo reboot
创建python3.10的虚拟环境,后续的安装都在虚拟环境下进行
- 创建并激活虚拟环境
conda create -n env python=3.10
conda activate env
安装cuda
到cuda官网找到cuda11.8的安装指令
cuda官网:
https://developer.nvidia.com/cuda-11-8-0-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=22.04&target_type=runfile_local
安装指令:
wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run
sudo sh cuda_11.8.0_520.61.05_linux.run
安装过程中,输入accept,在cuda installer中仅选择cuda toolkit即可:
安装之后需要进行后续操作添加环境变量:
打开环境变量文件
sudo vim ~/.bashrc
在文件的最后添加cuda路径
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
保存文件后,输入指令
source ~/.bashrc
之后输入测试指令:
nvcc --V
弹出以下内容证明安装成功
安装cudnn
找到官网
https://developer.nvidia.com/cudnn-downloads?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=22.04&target_type=deb_local
根据官网给出指令安装,官网给出指令为
wget https://developer.download.nvidia.com/compute/cudnn/9.7.1/local_installers/cudnn-local-repo-ubuntu2204-9.7.1_1.0-1_amd64.deb
sudo dpkg -i cudnn-local-repo-ubuntu2204-9.7.1_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2204-9.7.1/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudnn-cuda-11