Ubuntu22.04安装NVIDIA驱动+CUDA+CUDNN+Anaconda+PyTorch+Pycharm


前言

换新的工作机器,需要重新配置环境,记录以下安装过程的坑


一、安装NVIDIA驱动

1.查看自己电脑型号

lspci | grep -i nvidia

 进入下方网址查询自己的显卡

PCI Devices

2.进入NVIDIA官网下载驱动

 下载 NVIDIA 官方驱动 | NVIDIA

 选择下载之后得到一个后缀名为run的文件

3.准备工作下载依赖

 1)禁用BIOS中的安全启动模式secure boot,这是因为此方法使用第三方源安装显卡驱动,不禁止secure boot会导致安装的驱动不能使用,禁用也不会有多大安全隐患。不禁用后面会导致安装出现error并且fail。具体做法是:

开机进入BIOS,然后选择安全模式,禁止。

2)移除所有以前安装过的nvidia包(如果需要的话)

sudo apt-get purge nvidia*

3)禁用nouveau;创建文件,方式选择下面方法之一,一般人很少用vim(vim是a或者i开启编辑,esc退出,输入:wq保存退出),习惯用自带的gedit命令直接打开相当于记事本那样编辑:

sudo nano /etc/modprobe.d/blacklist.conf
sudo gedit /etc/modprobe.d/blacklist.conf
sudo vim /etc/modprobe.d/blacklist.conf

插入代码到blacklist.conf文本最下面,如下

 blacklist nouveau
 options nouveau modeset=0

执行命令禁止nouveau,并重启生效

sudo update-initramfs -u
sudo reboot

重启后,打开终端检查nouveau是否被禁用;

输入下面代码验证,若执行完该句,没有任何输出,则nouveau被成功禁用。

lsmod | grep nouveau

4) 在安装驱动之前需要安装gcc和相应的依赖:

sudo apt-get install build-essential 
sudo apt-get install cmake

 查看gcc和cmake有没有安装成功:

gcc --version
cmake --version

5) 没有lightdm需要安装一下:

sudo apt-get install lightdm

6) 附:上述安装如果一直安装不下来,于是换镜像源,更换前最好先备份:

sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak
sudo nano /etc/apt/sources.list

将原有的源都加#注释,在最后换成自己想要的源,下面的是阿里云

deb http://mirrors.aliyun.com/ubuntu/ focal main restricted
deb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted
deb http://mirrors.aliyun.com/ubuntu/ focal universe
deb http://mirrors.aliyun.com/ubuntu/ focal-updates universe
deb http://mirrors.aliyun.com/ubuntu/ focal multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-updates multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted

更换源后需要更新

sudo apt-get update
sudo apt-get upgrade

4.一切就绪,开始安装

打开NVIDIA-Linux-x86_64-570.86.16.run文件所在目录,右键在终端打开或者cd到NVIDIA-Linux-x86_64-570.86.16.run文件所在的文件夹

 运行如下命令,修改驱动文件的权限并执行安装

sudo chmod +x NVIDIA-Linux-x86_64-570.86.16.run
sudo ./NVIDIA-Linux-x86_64-570.86.16.run

会载入一段时间,然后显示,安装过程中会进入一个交互式界面,按键盘的左右箭头选择相应选项,按回车键确认:

回车下一步,选择continue installation

接下来,系统会询问是否需要内核签名。此时,选择 Sign the kernel(签名内核)回车继续

系统将提示你创建新的密钥对,选择 Create new key pair(创建新密钥对)这就会在/usr/share/nvidia/下生成一个nvidia*.der文件和nvidia*.key文件,前一个是私钥,后一个是公钥。

完成签名后,删除密钥:

注意:如果出现以下提示,说明由于系统的 BIOS 启用了 Secure Boot,这可能会导致内核加载失败。此时,您需要进入 BIOS 设置中禁用 Secure Boot

安装完成后,系统会询问是否需要安装 nvidia-x-config,该工具会提供一个图形界面的显卡管理工具。建议选择 Yes 进行安装。

安装完成后,重启系统:

sudo reboot

 重启后,使用以下命令检查显卡状态,出现下图表示安装成功:

nvidia-smi

5.不利用安装包安装,特别慢

按照顺序执行下面代码

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

指定版本安装用下面这个

sudo apt install nvidia-driver-570

自动读取配置安装用这个

sudo ubuntu-drivers autoinstall

二、Cuda安装

1.选择适合自己的版本号,下面官网中挑选

CUDA Toolkit 12.4 Update 1 Downloads | NVIDIA 开发者

2.终端使用如上图所示指令进行下载:

wget https://developer.download.nvidia.com/compute/cuda/12.4.1/local_installers/cuda_12.4.1_550.54.15_linux.run

sudo sh cuda_12.4.1_550.54.15_linux.run

安装时,仍会提示目标CUDA toolkit对应版本的显卡驱动未被发现,推荐我们安装其版本的显卡驱动,这时我们键入continue,再键入accept同意用户协议,然后将光标移动到driver处,键入回车,以取消对驱动的安装:其他的保持不动,选择“Install”,稍等几分钟就装好了

 

出现此画面,表示安装成功

3.配置环境变量

sudo gedit ~/.bashrc

在尾部加入以下内容(路径不一定和我一样,看版本号)

export PATH=/usr/local/cuda-12.4/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

更新环境变量

source ~/.bashrc

4.查看CUDA版本信息

nvcc -V

5.测试CUDA(非必要) 

打开下载位置,随便运行一个

 例如bandwidthTest,看到下图说明安装成功

三、cuDNN安装

1.选择适合自己的的cuda版本和系统进行下载

cuDNN Archive | NVIDIA Developer

完成后,出现cudnn-local-repo-ubuntu2204-8.9.7.29_1.0-1_amd64.deb

2.用终端打开,执行命令等待完成

sudo dpkg -i cudnn-local-repo-ubuntu2204-8.9.7.29_1.0-1_amd64.deb

四、安装Anaconda

1.下载完成之后,进入相应目录

2.运行如下指令,进行安装

bash ./Anaconda3-2024.10-1-Linux-x86_64.sh

 sh Anaconda3-2024.10-1-Linux-x86_64.sh

1、安装过程中根据提示输入enter; 

2、最后一部问是否添加环境变量,最好选择yes;

3、验证安装(重开终端窗口)(如果不行可能是环境变量没加进去)(或source环境)

conda -V

3.常用命令

查看当前所有的env

conda env list

创建新的env

例如这个语句就是创建一个名字叫nv的,python版本为3.9的一个虚拟环境

conda create -n nv python=3.9

激活环境命令

conda activate pt

退出环境命令

conda deactivate

五、安装Pytorch

1.下载位置

Previous PyTorch Versions | PyTorch

2.安装命令

conda install pytorch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 pytorch-cuda=12.4 -c pytorch -c nvidia

如果进入自己的conda虚拟环境,激活后,运行上方指令。

六、PyCharm安装及使用torch

1.下载位置

PyCharm: the Python IDE for data science and web development

下载解压之后,进入解压目录,进入bin目录,./pycharm.sh可以运行,可以在里面设置快捷方式;

在工具栏Tools,有Create Desktop Entry..,可以创建快捷方式。

2.新建工程

选择

选择环境使用conda,然后Interpreter选择自己刚才建立的虚拟环境 

3.代码测试torch

import torch
 
print(torch.cuda.is_available())
a = torch.zeros(5, 3)
print(a)


七、参考链接

Ubuntu20.04安装CUDA+CUDNN+Conda+PyTorch_ubuntu20.04安装cuda10.2-优快云博客

Ubuntu18.04安装Nvidia驱动【全网不坑,超全步骤】(亲测~)_ubuntu18.04安装nvidia显卡驱动-优快云博客 Ubuntu22.04安装CUDA+CUDNN+Conda+PyTorch_ubuntu22安装cuda conda-优快云博客

Ubuntu20.04安装CUDA+CUDNN+Conda+PyTorch_ubuntu20.04安装cuda10.2-优快云博客

【深度学习环境配置】ubuntu 20.04+4060 Ti+CUDA 11.8+pytorch(装机、显卡驱动、CUDA、cudnn、pytorch)_4060ti cuda cudnn-优快云博客 Ububtu20.04 CUDA安装与环境配置、CUDNN安装_ubuntu20.04查看cunda-优快云博客

Ubuntu24版 最新安装Nvidia显卡驱动方式_ubuntu安装nvidia显卡驱动-优快云博客


总结

新设备安装深度学习环境。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值