【转载】Linux安装CUDA 和 cuDNN,以及CUDA个人环境和系统环境的切换

文章介绍了如何在Linux服务器上安装和管理多个CUDA版本,并指出如何查看PyTorch实际使用的CUDA版本,强调了torch.version.cuda并不一定反映运行时的版本。同时,提到了环境变量配置对切换CUDA版本的影响,以及nvcc-V和nvidia-smi显示不同版本的原因。
部署运行你感兴趣的模型镜像

Linux服务器可以装多个cuda版本,可以在自己bashrc下切换,也可以切换默认的/usr/local/cuda指向的cuda版本。以下为会用到的一些内容,仅为转载。

查看目前虚拟环境pytorch使用的cuda版本。

正确查看方式:

想要查看 Pytorch 实际使用的运行时的 cuda 目录,可以直接输出之前介绍的 cpp_extension.py 中的 CUDA_HOME 变量。

import torch
import torch.utils
import torch.utils.cpp_extension
torch.utils.cpp_extension.CUDA_HOME        #输出 Pytorch 运行时使用的 cuda 

在这里插入图片描述
上面输出的/usr/local/cuda即为软链接的cuda版本。

不正确查看方式:

事实上,使用torch,version.cuda命令查看输出的 cuda 的版本并不一定是 Pytorch 在实际系统上运行时使用的 cuda 版本,而是编译该 Pytorch release 版本时使用的 cuda 版本。
在这里插入图片描述

参考:1. 查看pytorch运行时真正调用的cuda版本

CUDA和CUDNN的安装及检测

请参考,亲测可行

  1. 【Linux】安装CUDA 11.2 和 cuDNN 8.4.0并检查是否安装成功
  2. 服务器中安装多版本的cuda

注意安装完cuda后的环境变量配置,下面的配置是在~/.bashrc还是在/etc/profile中,取决于自己想改变的。如果一个服务器上有多个用户,前者只改变自己的cuda使用版本,后者改变默认的(即会影响别人的,如果别人用的是默认的)

export PATH=//usr/local/cuda-11.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.2/lib64$LD_LIBRARY_PATH

nvcc -V和nvidia-smi出现的cuda版本不同

系统安装了多个,怎么查看不同的版本?nvcc -V和nvidia-smi显示的cuda版本不同?
是由于CUDA有两个主要的API:runtime(运行时) API和driver API,具体地请参考:

nvcc -V和nvidia-smi出现的cuda版本不同


以上均为转载且标明出处,侵删。

您可能感兴趣的与本文相关的镜像

PyTorch 2.6

PyTorch 2.6

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

<think>好的,我现在需要帮助用户解决在Linux系统上安装CUDAcuDNNPyTorch的问题,同时要注意版本兼容性。首先,我需要回顾用户提供的引用内容,确保信息准确。 用户提到参考了安装CUDA之前的步骤,比如确认GPU是否支持CUDA,访问NVIDIA官网下载对应版本,安装过程包括驱动程序库的选择,以及验证安装。还有Anaconda虚拟环境的搭建,PyTorch安装。这些步骤需要详细梳理。 首先,安装前的准备:检查GPU型号,确保支持CUDA。用户可能在Linux下使用lspci或nvidia-smi命令。然后安装NVIDIA驱动,可能需要添加官方仓库或使用.run文件手动安装。这部分需要注意驱动版本与CUDA Toolkit的兼容性。 接下来是CUDA Toolkit的安装步骤,根据引用中的说明,下载对应版本的.run文件,执行安装安装时可能需关闭图形界面,进入命令行模式。然后配置环境变量,如PATHLD_LIBRARY_PATH,这一步很重要,否则系统可能找不到CUDA库。 然后是cuDNN安装,用户需要注册NVIDIA开发者账号,下载对应CUDA版本的cuDNN,解压并复制文件到CUDA目录。需要确保cuDNN版本与CUDA版本匹配,否则可能出错。 接下来是Anaconda安装,用于创建虚拟环境,管理Python依赖。安装后创建环境,激活,然后安装PyTorchPyTorch官网提供了不同CUDA版本的安装命令,必须选择与已安装CUDA版本兼容的PyTorch版本,否则无法利用GPU加速。 版本兼容性方面,需要确认CUDA Toolkit、cuDNNPyTorch之间的对应关系。例如,PyTorch 1.8可能要求CUDA 11.1,而cuDNN需要对应CUDA 11.x的版本。用户需要查阅各官方文档的版本要求,避免版本冲突。 验证安装部分,CUDA可以通过编译sample并运行deviceQuery来检查。cuDNN则可能通过检查头文件库文件,或者运行测试代码。PyTorch中则用torch.cuda.is_available()确认是否识别GPU。 可能遇到的问题包括驱动安装失败,CUDA路径未正确设置,版本不匹配导致运行时错误。需要提醒用户仔细检查版本,参考官方文档,逐步操作。 现在需要将这些步骤整理成清晰的教程,分步骤说明,强调版本兼容性,并给出验证方法。同时生成相关问题,帮助用户深入理解可能遇到的后续问题。</think>以下是在Linux系统上安装CUDAcuDNNPyTorch的详细步骤及版本兼容性说明: --- ### **1. 安装前准备** #### **1.1 确认GPU支持CUDA** - 执行命令查看GPU型号: ```bash lspci | grep -i nvidia ``` - 访问[NVIDIA CUDA支持列表](https://developer.nvidia.com/cuda-gpus)确认是否支持[^2]。 #### **1.2 安装NVIDIA驱动** - 禁用系统默认驱动: ```bash sudo nano /etc/modprobe.d/blacklist-nouveau.conf # 添加内容:blacklist nouveau / options nouveau modeset=0 sudo update-initramfs -u ``` - 重启后安装驱动: ```bash sudo apt install nvidia-driver-535 # 根据CUDA版本选择驱动版本 ``` --- ### **2. 安装CUDA Toolkit** #### **2.1 下载CUDA** - 访问[CUDA Toolkit官网](https://developer.nvidia.com/cuda-toolkit-archive),选择与驱动兼容的版本(例如CUDA 11.8)。 #### **2.2 安装CUDA** - 执行安装命令(以CUDA 11.8为例): ```bash sudo sh cuda_11.8.0_520.61.05_linux.run ``` - **安装选项**:取消勾选驱动(已提前安装所有组件(默认全选)。 #### **2.3 配置环境变量** - 在`~/.bashrc`中添加: ```bash export PATH=/usr/local/cuda-11.8/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH ``` - 生效配置: ```bash source ~/.bashrc ``` #### **2.4 验证CUDA** - 编译并运行示例程序: ```bash cd /usr/local/cuda/samples/1_Utilities/deviceQuery sudo make && ./deviceQuery ``` - 输出显示`Result = PASS`表示成功。 --- ### **3. 安装cuDNN** #### **3.1 下载cuDNN** - 访问[cuDNN官网](https://developer.nvidia.com/cudnn),选择与CUDA版本兼容的cuDNN(例如CUDA 11.x对应cuDNN 8.9.4)。 #### **3.2 安装cuDNN** - 解压并复制文件到CUDA目录: ```bash tar -xzvf cudnn-linux-x86_64-8.9.4.25_cuda11-archive.tar.xz sudo cp cuda/include/cudnn*.h /usr/local/cuda/include/ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn* ``` --- ### **4. 安装PyTorch** #### **4.1 创建Anaconda虚拟环境** - 安装Anaconda后创建环境: ```bash conda create -n pytorch_env python=3.9 conda activate pytorch_env ``` #### **4.2 安装PyTorch** - 根据CUDA版本选择PyTorch命令(CUDA 11.8对应PyTorch 2.0+): ```bash pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 ``` #### **4.3 验证PyTorch** - 运行Python检查GPU支持: ```python import torch print(torch.__version__) # 输出版本号(如2.0.1) print(torch.cuda.is_available()) # 输出True表示成功 ``` --- ### **版本兼容性表** | 组件 | 推荐版本 | 兼容范围 | |------------|----------------|------------------| | CUDA | 11.8 | 11.0~11.8 | | cuDNN | 8.9.4 | 需匹配CUDA版本 | | PyTorch | 2.0.1 | 需指定`cu118` | | NVIDIA驱动 | ≥535.86.05 | 需支持CUDA 11.8 | --- ### **相关问题** 1. 如何解决安装CUDA时出现的驱动冲突问题? 2. cuDNN未正确安装会导致哪些PyTorch错误? 3. 如何在多版本CUDA之间切换? 4. PyTorch如何强制使用CPU而非GPU? --- **引用说明** - 环境变量配置驱动安装步骤参考了CUDA官方文档。 - PyTorch安装命令需严格匹配CUDA版本[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值