ubuntu22.04版本安装显卡驱动-安装深度学习基本环境（conda/cudnn/anaconda/pytorch/pycharm）过程

棉花糖永远滴神

已于 2024-08-13 16:00:26 修改

阅读量2.2k

点赞数 18

CC 4.0 BY-SA版权

文章标签：深度学习 conda pytorch

于 2024-08-12 10:41:36 首次发布

本文链接：https://blog.youkuaiyun.com/qq_53092944/article/details/140504358

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

一、安装显卡驱动
二、安装conda
四、安装cuDNN
五. 安装anaconda
六、安装pycharm
七/创建conda虚拟环境
- 1.创建虚拟环境my_env
- 2.打开火狐浏览器里输入pytorch官网用来获取下载指令
CUDA 11.3
- 3.无法直接用网络安装pytorch，下载镜像文件到目录，在虚拟环境中离线安装
- 4.测试是否安装成功
八/ 下载yolov5代码，用pycharm打开

一、安装显卡驱动

我的显卡是gtx1660super，我首先看了一些博主的教程，发现有点复杂，需要去官网下载相关驱动，然后禁用集显，然后再用一些命令行安装，比较麻烦，然而现在ubuntu的软件安装与更新可以自动安装显卡驱动了。

等安装好后直接重启即可。
在这里插入图片描述

二、安装conda

1.进入CUDA官网复制所需版本的安装命令

访问CUDA官网，选择你需要下载的CUDA版本，我选择的是CUDA11.3.0
官方下载链接：https://developer.nvidia.com/cuda-downloads。

CUDA大版本与显卡驱动里面的CUDA Version的大版本相同即可，小版本不影响

https://developer.nvidia.com/cuda-11.3.0-download-archive
在这里插入图片描述

然后选好对应的系统配置后下载run版本的，复制官方给出的Installation Instructions:的指令到终端中运行：

wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/
cuda_11.3.0_465.19.01_linux.runsudo sh cuda_11.3.0_465.19.01_linux.run

安装过程中，首先输入accept，取消勾选Driver（已经安装了驱动），选择Install，回车
在这里插入图片描述
我们在第二步已安装显卡驱动Driver，由此Driver不选，只需要把cuda tool勾选即可

2.当执行cuda_11.3.0_465.19.01_linux.runsudo sh cuda_11.3.0_465.19.01_linux.run时会出现gcc报错

这是由于gcc版本不匹配的问题
2.2.2解决方法二

变更gcc版本
2.2.2.1 CUDA11.0

可能你的gcc版本太高，变更gcc版本为9

 sudo apt install gcc-9 g++-9
     
 sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-11 70 --slave /usr/bin/g++ g++ /usr/bin/g++-11
     
 sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 100 --slave /usr/bin/g++ g++ /usr/bin/g++-9

# 10，20这些表示的是优先级，可根据需要选定，优先级高的即为默认的。

切换gcc版本，这里输入2，选择gcc-9

sudo update-alternatives --config gcc

查看更改结果

gcc --version

3.配置环境变量

在.bashrc内把cuda的目录加入到PATH中，否则的话系统找不到CUDA

sudo gedit  ~/.bashrc

在文件末尾加上（注意更改cuda版本为你安装的版本号，这里是cuda-11.0）
注意：这个三行的路经千万不要用，因为我的电脑装了ros2,再运行ros2时会出现兼容性问题报错

rcl_action.so: cannot open shared object file: No such file or directory

  export CUDA_HOME=/usr/local/cuda-11.0
    export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
    export PATH=${CUDA_HOME}/bin:${PATH}

所以要用下面这个，把11.0改为自己下载的版本号：

export PATH=/usr/local/cuda-11.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64:$LD_LIBRARY_PATH

运行.bashrc文件

$source ~/.bashrc

4.测试是否安装成功

终端输入

nvcc -V

出现下列页面，,显示的cuda版本正是所安装版本，说明CUDA安装成功

四、安装cuDNN

1.下载cuDNN

cuDNN官网cuDNN Archive | NVIDIA Developer

进cudnn官网下载前需要先登录，然后选择与CUDA版本对应的版本下载。
这里我一直进不去官网，ubuntu又不知道怎么挂梯子，所以先在windows系统挂梯子下载好文件然后传到ubuntu上

2.解压文件

首先cd进入下载的文件夹，我的下载到Downloads文件夹下

cd Downloads

使用tar工具解压，tar是tape archive的全称，它预装在Linux系统中。 xz是一个基于LZMA算法的文件压缩算法，使用xz算法压缩的文件通常以.tar.xz或.txz结尾。

解压tar.xz文件，可以使用tar命令带上-x（–extract）选项并用-f指定压缩文件名，

tar -xf后面加的是刚才下载好的cudd的压缩文件名

tar -xf cudnn-Linux-x86_64-8.9.5.30.tar.xz

3.复制文件

将解压出的cuda目录下的inlcude内的头文件以及lib内的链接库全部复制到/usr/local/cuda的对应文件夹下：（注意自己的目录名，有的文件夹名是lib，有的是lib64）

sudo cp cuda/lib64/* /usr/local/cuda-11.0/lib64/
 sudo cp cuda/include/* /usr/local/cuda-11.0/include/

至此，GPU驱动、CUDA、cudnn就都安装好了。

五. 安装anaconda

Anaconda是一种软件包管理，它为编程语言Python和R提供图形导航，支持数据科学、数据分析和机器学习。
Anaconda让您不必担心有时遇到复杂的依赖关系问题。此外，Anaconda有一个名为Conda的包管理器，它可以使分发中的所有包保持最新。它促进了库和开发环境的安装和管理，支持在Python和R下进行数据分析和机器学习。总的来说，有许多软件包可用，包括Jupyter Notebook、Spyder、NumPy和TensorFlow。
Anaconda可用于Microsoft Windows、macOS和Linux的个人、商业、团队和企业版本。个人版是开源软件，作为免费软件免费，因此，例如，私人用户可以学习如何处理数据分析。付费版商业版、团队版和企业版为商业使用和公司使用提供了广泛的功能。

1.下载anaconda安装程序，可以anaconda官网或在清华大学开源软件镜像站下载anaconda。

2.运行安装程序

执行bash命令，bash后面是下载好的anaconda文件名

bash Anaconda3-2023.03-1-linux-x86-64.sh

然后一直按回车，yes同意隐私条款

3.配置环境

在 ~/.bashrc 末尾添加:

export PATH="~/anaconda3/bin":$PATH
 
source ~/anaconda3/bin/activate

后执行：

source ~/.bashrc

完成后，进入Anaconda的默认base编程环境中

接下来就可以和windows下一样，使用conda指令创建环境，安装包了

最后测试anaconda是否成功：

conda list

如果出现很多包名，就说明可以了。

六、安装pycharm

可以直接在Ubuntu Software中搜索pycharm并安装
在这里插入图片描述

七/创建conda虚拟环境

1.创建虚拟环境my_env

使用annaconda的conda命令创建虚拟环境，我的环境My_torch

   conda create -n <环境名称自定义> python=<python的版本号>

例如：conda create -n My_torch python=3.8   输入后回车

完成后显示done，这样我们就创建好啦：接下来

source activate <你的虚拟环境>

成功后可以看到你的环境从base变成了My_torch

2.打开火狐浏览器里输入pytorch官网用来获取下载指令

【Pytorch官网】https://pytorch.org/

由于我的conda版本是11.3,所以到previous过去版本中选择conda版本，选择版本，下面得到安装指令

CUDA 11.3

conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch

在我的my_env环境中进行安装：

如图，总是报错httperror，说明是网络问题。没办法
原文用官网能装上但我装不上，在验证阶段一直返回false。

解决办法：去清华大学镜像站下载链接：清华镜像

https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/

然后根据conda install pytorch1.12.1 torchvision0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch
这里面的版本去一个个查询对应的版本的文件再下载

3.无法直接用网络安装pytorch，下载镜像文件到目录，在虚拟环境中离线安装

source activate Deeplearning \激活你创建的虚拟环境

conda install --offline pytorch-2.1.1-py3.11_cuda12.1_cudnn8.9.2_0.tar.bz2

conda install --offline torchaudio-2.1.1-py311_cu121.tar.bz2

conda install --offline torchvision-0.16.1-py311_cu121.tar.bz2

4.测试是否安装成功

最后验证:

source activate Deeplearning \\激活你创建的虚拟环境
python \\运行python (启动命令与你上文中起的别名有关)
import torch \\导入torch模块,这里应该没有任何输出
torch.cuda.is_available() \\输出True则安装成功
exit() \\退出python
conda deactivate Deeplearning \\退出虚拟环境

很不幸，又又又报错了：当我import torch时，报错：
忘记了，反正找了一堆教程都不行，实在没辙，我感觉可能是之前的一个疏忽导致的：

就是我使用conda create创建一个新的虚拟环境时，终端的前缀是（base），也就是说我把新的虚拟环境创建在了base虚拟环境的路径中了，导致无法检索到，所以我干脆使用conda deactivate删除了这个环境，新建了一个zyl_torch环境，这次我特地先cd ~/，没在base里创建，然后使用offline离线安装那三个安装包

但是，依然报错，no moudle name torch，我福了。
没想到峰回路转，我直接用官方命令：
conda install pytorch1.12.1 torchvision0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch
居然这次网络正常了，下载后 import torch 没有报错了。

然饿，当我 torch.cuda.is_available() 时，又又又又报错了，返回了false。

最后发现，conda install pytorch1.12.1 torchvision0.13.1 torchaudio0.12.1 cudatoolkit=11.3 -c pytorch这个指令不好用，我又回退了一个版本，再次创建了一个新的虚拟环境mytest，
conda install pytorch1.11.0 torchvision0.12.0 torchaudio0.11.0 cudatoolkit=11.3 -c pytorch
这个版本安装之后，就返回ture了。

注意一个重要问题：
①如果不用国内源，就要开梯子代理来下载
②如果添加了国内源：

channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

就需要先关闭梯子，不然会一直卡住。

八/ 下载yolov5代码，用pycharm打开

1.下载代码

去这个网站clone代码：https://github.com/ultralytics/yolov5
解压后在pycharm中打开。选择解释器的环境为创建的虚拟环境zyl_torch

然后安装requirements.txt
这里我先直接下载
pip install -r requirements.txt
到一半网络超时了，所以用清华园下载
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple