1. 下载nvidia驱动
查看显卡型号:
lspci | grep -i vga
将终端代号输入:https://admin.pci-ids.ucw.cz/mods/PC/10de?action=help?help=pci ,可得到具体显卡型号。
我的是getforce RTX 4080
下载对应驱动:https://www.nvidia.cn/drivers/lookup/
点击查找,查看对应驱动版本。我的是570
我没有采取下载下来再手动安装的方式,手动安装时禁用图形界面一直出问题。
2. 安装nvidia驱动
安装相关依赖
sudo apt-get install python3-pip
sudo apt-get install python3-pip
sudo apt-get install build-essential libglvnd-dev pkg-config
sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
sudo apt-get install --no-install-recommends libboost-all-dev
sudo apt-get install libopenblas-dev liblapack-dev libatlas-base-dev
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
运行lsmod | grep nouveau,若有输出,则进行禁用。
禁用nouveau驱动:
在/etc/modprobe.d/blacklist.conf后添加:
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
然后更新:
sudo update-initramfs -u
电脑重启
运行lsmod | grep nouveau,若无输出,则禁用成功。
配置环境变量:
sudo nano ~/.bashrc
在末尾添加:
export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
source ~/.bashrc
添加nvidia ppa源:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
安装对应驱动:
sudo apt install nvidia-driver-570
重启系统。
检测安装状态:nvidia-smi
2. 安装cuda
进入官网,选择对应版本:CUDA Toolkit - Free Tools and Training | NVIDIA Developer
下载:可以将链接复制到浏览器中下载
赋予权限,运行:sudo ./cuda_12.8.1_570.124.06_linux.run
终端一直没反应可以拉一下框,可能是显示不全。
光标停留在driver那行,按回车取消下载driver。因为driver之前已经安装过了。
选择install回车。
检查是否安装成功:
cat /usr/local/cuda/version.txt
如果找不到文件的话,路径下存在version.json也可以。
设置环境变量:
在/home/priscilla/.bashrc末尾添加:注意更改为实际文件与实际路径。
export PATH=/usr/local/cuda-12.8/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存退出,终端运行:source ~/.bashrc
终端运行:nvcc -V:
说明安装成功。
3. 安装cuDNN
进入官网:cuDNN 9.2.0 下载 | NVIDIA 开发者,选择对应版本。可能需要注册,填信息即可。
使用官网下面的安装instructions:
wget https://developer.download.nvidia.com/compute/cudnn/9.2.0/local_installers/cudnn-local-repo-ubuntu2204-9.2.0_1.0-1_amd64.deb
sudo dpkg -i cudnn-local-repo-ubuntu2204-9.2.0_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2204-9.2.0/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudnn
安装验证:
cp -r /usr/src/cudnn_samples_v9/ $HOME
cd $HOME/cudnn_samples_v9/mnistCUDNN
make clean && make
在执行时出现freeimage找不到
安装:
sudo apt-get install libfreeimage3 libfreeimage-dev
重新make clean && make
运行:
./mnistCUDNN
出现test passed! 表示安装完成。
4. 搭建yolo环境
安装conda并创建env=yolov5 的conda环境
conda create --name yolov5
conda activate yolov5
官网下载的yolov5-6.2,解压: tar -xzvf yolov5-6.2.tar.gz
赋予可执行权限:
sudo chmod 777 -R yolov5_v6.2/
安装相关依赖包:
pip install -r requirements.txt --user -i https://pypi.tuna.tsinghua.edu.cn/simple
训练测试:
python train.py
Ok!