ubuntu20.04+nvidia 525.105.17+cuda10.2+cudnn8.0+tensorrt8.0+tensorflow+pytorch+Eigen+CeresSolver+g2o

原创

已于 2024-12-20 08:42:59 修改 · 1.6k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#ubuntu #tensorflow #pytorch

于 2020-12-10 11:22:23 首次发布

本文介绍如何在Linux环境下安装配置NVIDIA驱动、CUDA、cuDNN、TensorRT等软件，包括详细的步骤说明和常见问题解决方案。

NVIDIA相关软件
nvidia 440.100 + cuda 10.2 + cudnn 8.0
在这里插入图片描述

pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple

适合于: GTX 2080, GTX1650Ti等显卡
文件列表如下:

NVIDIA-Linux-x86_64-440.100.run
cuda-repo-ubuntu1604-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
cudnn-10.2-linux-x64-v8.0.2.39.tgz
TensorRT-7.1.3.4.Ubuntu-16.04.x86_64-gnu.cuda-10.2.cudnn8.0.tar.gz

cuda和nvidia版本匹配如下：
在这里插入图片描述

1 NVIDIA驱动安装

进入网站进行选择驱动版本
https://www.nvidia.cn/geforce/drivers/

1.1 软件安装:

1:进入
 Ctrl +Alt+F1 进入命令行模式 18.04
 Ctrl +Alt+F3 进入命令行模式 20.04
安装图形界面

首先需要安装lightdm，主要是用来关闭启动图形界面用，主要管理登录界面，ubuntu20.04需要自行安装,然后选择lightdm即可

sudo apt-get install lightdm


 或者 sudo lightdm service stop
2: 添加
编辑文件 blacklist.conf
sudo vim /etc/modprobe.d/blacklist.conf 在文件最后部分插入以下内容
blacklist nouveau
options nouveau modeset=0
3:跟新
sudo update-initramfs -u
4:查看是否禁用， 无输出，则正常
lsmod | grep nouveau
5:安装
sudo ./NVIDIA-Linux-x86_64-418.56.run -no-x-check -no-opengl-files
-no-x-check:安装驱动时关闭 X 服务
-no-opengl-files:只安装驱动文件,不安装 OpenGL 文件
6:查看，安装
nvidia-smi 查看

20.04文本命令，进入后，使用sudo会出现***，输入密码后可用sudo

退出文本两外方法
单次退出sudo systemctl start graphical.target 20.04


要持续取消Ubuntu 20.04默认进入文本模式，您可以按照以下2个步骤操作：

步骤一：
    修改GRUB配置：
    打开GRUB配置文件：
		sudo nano /etc/default/grub
		修改GRUB命令行，找到 GRUB_CMDLINE_LINUX_DEFAULT 这一行，通常默认值是 quiet splash。将其修改为 quiet splash（去掉 text 参数）：
		GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
		更新GRUB配置：
		sudo update-grub
		重启系统：
		sudo reboot

步骤二：
		修改系统启动目标：
	
		如果您的系统使用 systemd，您需要将默认目标从 multi-user.target 更改回 graphical.target：
		
		sudo systemctl set-default graphical.target
		
		重启系统以应用更改：
		
		sudo reboot

Method 2：
sudo add-apt-repository
ppa:graphics-drivers #添加源
sudo apt-get update
sudo apt-cache search nvidia #查找安装包
//会输出 info
sudo ubuntu-drivers devices sudo apt-get install nvidia-390
nvidia-settings nvidia-prime #安装驱动

2 CUDA安装

2.1 软件安装:

sudo dpkg -i cuda-repo-ubuntu1604-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
//上一步会输出 接下来的命令,如:
sudo apt-key add /var/*
sudo dpkg -i cuda-repo-ubuntu1604-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
//然后进行安装
sudo apt-get update
sudo apt-get install cuda

如果之前安装过，卸载不干净，
CUDA完全卸载的方法：
sudo apt-get --purge remove “cublas” “cuda*”
sudo apt-get --purge remove “nvidia”
sudo apt-get purge nvidia*
sudo apt-get autoremove
sudo apt-get autoclean
sudo rm -rf /usr/local/cuda*

2.2 环境安装:
添加CUDA路径,运行gedit ~/.bashrc

export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda-10.2
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-10.2/bin:$PATH

接下来运行source ~/.bashrc使设置生效。

2.3 检查CUDA版本

cd /usr/local/cuda-10.2/samples/1_Utilities/deviceQuery
make
sudo ./deviceQuery

若输出最后一行为Result=PASS,则验证成功。

查看环境对不对

echo $LD_LIBRARY_PATH

sudo ldconfig

ldconfig: /usr/local/cuda-11.1/targets/x86_64-linux/lib/libcudnn_ops_train.so.8 不是符号连接
ldconfig: /usr/local/cuda-11.1/targets/x86_64-linux/lib/libcudnn_ops_infer.so.8 不是符号连接
ldconfig: /usr/local/cuda-11.1/targets/x86_64-linux/lib/libcudnn_cnn_train.so.8 不是符号连接
ldconfig: /usr/local/cuda-11.1/targets/x86_64-linux/lib/libcudnn.so.8 不是符号连接
ldconfig: /usr/local/cuda-11.1/targets/x86_64-linux/lib/libcudnn_cnn_infer.so.8 不是符号连接
ldconfig: /usr/local/cuda-11.1/targets/x86_64-linux/lib/libcudnn_adv_train.so.8 不是符号连接
ldconfig: /usr/local/cuda-11.1/targets/x86_64-linux/lib/libcudnn_adv_infer.so.8 不是符号连接



sudo ln -sf /usr/local/cuda-10.2/targets/x86_64-linux/lib/libcudnn