Ubuntu22.04下使用Conda安装PyTorch GPU版本

该文介绍了在Ubuntu22.04系统中,如何检查NVIDIAGPU及驱动信息,然后详细阐述了通过Conda进行环境管理,包括下载、安装Conda,创建和管理虚拟环境,以及如何在虚拟环境中安装PyTorch的GPU版本,最后验证了CUDA和PyTorch的安装成功。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

环境

首先,你需要有 GPU 支持。
Ubuntu 22.04
显卡

$ nvidia-smi
Mon May 22 11:15:33 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 530.30.02              Driver Version: 530.30.02    CUDA Version: 12.1     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                  Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf            Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  NVIDIA A100 80GB PCIe           On | 00000000:21:00.0 Off |                    0 |
| N/A   34C    P0               45W / 300W|      4MiB / 81920MiB |      0%      Default |
|                                         |                      |             Disabled |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A      3309      G   /usr/lib/xorg/Xorg                            4MiB |
+---------------------------------------------------------------------------------------+

安装

Conda 安装

使用 Conda 的最大好处就是包环境管理。最大坏处就是屎一样大。

下载

目前 Conda 最新版本是 2023.03-1,参考 https://repo.anaconda.com/archive/
使用命令行

wget https://repo.anaconda.com/archive/Anaconda3-2023.03-1-Linux-x86_64.sh

安装

使用命令行

chmod +x Anaconda3-2023.03-1-Linux-x86_64.sh
./Anaconda3-2023.03-1-Linux-x86_64.sh

即可完成安装。

Conda 常用命令

查看虚拟环境

使用命令行

conda env list
创建虚拟环境

使用命令行

conda create --name 虚拟环境名字 python=3.8

python=3.8 是指定 python 软件包版本。

激活虚拟环境

使用命令行

conda activate 虚拟环境名字
退出虚拟环境

使用命令行

conda deactivate
删除虚拟环境

使用命令行

conda remove -n 虚拟环境名字 --all

PyTorch 官网支持

请到官网 https://pytorch.org/get-started/locally/,Torch 提供了对应的选择。选择如下
在这里插入图片描述

创建 torch 虚拟环境

conda create --name torch python=3.8

激活 torch 虚拟环境

conda activate torch

激活成功后,将出现以下的状态

(torch) 用户名@服务器名:~

安装 torch

参考官网给出的命令行。

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

我前面几次安装 torch 都是 cpu 版本。惭愧参看了好多资料才正确安装 GPU。否则浪费了 A100 最新版本。

验证安装

使用 python 进入命令行状态

Python 3.8.16 (default, Mar  2 2023, 03:21:46)
[GCC 11.2.0] :: Anaconda, Inc. on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> print(torch.__version__) #打印torch版本
2.0.1
>>> print(torch.backends.cudnn.version()) #打印cudnn版本
8700
>>> print(torch.version.cuda) #打印cuda版本
11.8
>>> torch.cuda.is_available() #cuda是否使用
True
>>> print(torch.cuda.get_device_name(0)) #打印GPU
NVIDIA A100 80GB PCIe

这样,我们就打完收工。

### 安装和配置支持GPUPyTorch #### 准备工作 为了确保系统的软件包是最新的,在开始之前更新系统中的所有现有软件包[^2]。 ```bash sudo apt-get update && sudo apt-get upgrade -y ``` #### 安装必要的工具 安装一些基本命令行工具,这些对于后续操作非常有用: ```bash sudo apt-get -y install python3-pip vim git ``` 创建并编辑pip配置文件来加速Python库下载速度: ```bash mkdir ~/.pip && vim ~/.pip/pip.conf ``` 在`pip.conf`中加入阿里云镜像源的内容以提高国内用户的下载效率: ``` [global] index-url = https://mirrors.aliyun.com/pypi/simple/ timeout = 60 ``` #### 配置CUDA环境 由于目标是在Ubuntu 22.04上使PyTorch能够利用GPU资源,因此需要先正确设置NVIDIA驱动程序以及相应的CUDA版本。如果遇到`Driver/library version mismatch.`错误,则表明当前使用的NVIDIA驱动器与CUDA Toolkit之间存在不兼容的情况[^3]。解决办法之一是从头开始按照官方指南重新部署整个图形栈,包括但不限于卸载旧版驱动、安装新版驱动等措施;另一种方法是调整已有的组件使之相互匹配。 建议遵循[NVIDIA官方网站](https://www.nvidia.cn/)给出的具体指导完成这一步骤。通常情况下,通过运行以下命令可以获取适合特定硬件的最佳组合方案: ```bash ubuntu-drivers devices ``` 接着依据提示选择合适的选项进行安装。完成后重启计算机让更改生效。 #### 创建Miniconda虚拟环境 考虑到不同项目可能依赖于不同的Python版本及其第三方模块集合,建立独立的工作区是非常明智的选择。这里推荐采用Miniconda作为管理工具,因为它轻量级且易于维护。具体做法如下所示: 1. 下载最新稳定发行版; 2. 执行脚本完成本地化定制过程; 3. 加载新路径变量以便立即可用conda指令集; 4. 构建专属空间用于容纳即将引入的目标框架实例。 ```bash wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda3-latest-Linux-x86_64.sh source ~/.bashrc conda create --name pytorch_env python=3.9 conda activate pytorch_env ``` #### 安装PyTorch及相关依赖项 最后也是最关键的环节就是把焦点放在核心主题——即如何顺利地将带有GPU加速特性的PyTorch集成进来。鉴于先前已经妥善处理好了底层设施层面的事情(比如操作系统补丁级别、显示适配器固件状态),现在只需专注于高层应用部分即可。此时应当参照官方发布的说明文档挑选恰当的方式来进行实际部署动作。例如,可以通过pip或者conda渠道实现快速便捷的一键式安装体验。下面展示的是基于pip的方法: ```bash pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117 ``` 上述命令会自动拉取适用于CUDA 11.7平台架构下的预编译二进制文件,并将其余必要组成部分一同打包进去形成完整的解决方案套件[^1]。 验证安装成功与否的一种简单方式便是启动交互式的解释器界面尝试调用`nvidia-smi`命令看能否正常返回有关物理设备的信息列表。另外也可以编写一小段测试代码片段用来确认API接口是否能按预期发挥作用。 ```python import torch print(torch.cuda.is_available()) print(torch.__version__) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

努力的老周

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值