【深度学习环境】Linux下安装、切换cuda和cudnn

本文详细介绍了如何选择和安装CUDA与cuDNN,包括根据PyTorch和显卡驱动适配选择CUDA版本,获取并安装CUDA安装包,设置环境变量,以及下载和配置cuDNN的过程。
部署运行你感兴趣的模型镜像

选择CUDA版本号

需要考虑的有两点:
(1)pytorch适配
https://pytorch.org/get-started/locally/
(2)显卡驱动适配
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

安装cuda

  1. 打开下载链接
  2. 选择操作系统、架构、版本、安装方式
    ps:如果要选择非最新版本cuda, 点击下方的legacy releases
    在这里插入图片描述
  3. 输入Installation Instructions中的指令获取安装包并开始安装
### 获取安装包
wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run
### 开始安装
sudo sh cuda_10.1.243_418.87.00_linux.run
  1. 安装过程
  • 首先会出现一系列协议,一直按住Enter键。之后会出现一系列选项。
  • 第一个选择accept
  • 第二个记得取消驱动选项.
  • 后面全部选择y
    在这里插入图片描述
    在这里插入图片描述
  1. 设置cuda环境变量
    输入 sudo gedit ~/.bashrc 打开主目录下的 .bashrc文件添加如下内容:
### 注意 12.2为版本号,应当替换为刚刚下载的版本
export PATH="/usr/local/cuda-12.2/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-12.2/lib64:$LD_LIBRARY_PATH"  
  1. 终端运行:source ~/.bashrc 使之生效
  2. 检查是否安装成功:
    输入nvcc --version,如果显示如下文字就说明安装成功
    在这里插入图片描述
  3. 如果显示错误,注销一下用户

安装cudnn

官方教程

  1. 打开下载链接,选择相应的版本并下载。选择方法可参考https://blog.youkuaiyun.com/MumuziD/article/details/118760650,建议直接选择cuDNN Library for Linux (x86_64)
  2. 进入cudnn压缩包所在的文件夹,解压文件
tar -xvf cudnn-10.1-linux-x64-v7.6.4.38.tgz
  1. 将文件拷贝到相应cuda目录下
### 注意 10.1为版本号,应当替换为刚刚下载的版本
### 注意安装过程中不要随意切换路径
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.1/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64/
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h
sudo chmod a+r /usr/local/cuda-10.1/lib64/libcudnn*
  1. 查看cudnn版本
### 注意 10.1为版本号,应当替换为刚刚下载的版本
cat /usr/local/cuda-10.1/include/cudnn.h | grep CUDNN_MAJOR -A 2

出现如下的信息,则为配置成功
在这里插入图片描述

  1. 注意

如果上述操作无显示,可能是因为cuda及cudnn版本比较新(如cuda 11.3 + cudnn 8.2),cudnn的版本信息存储在cudnn_version.h文件中。因此需要添加如下操作:

sudo cp cuda/include/cudnn_version.h /usr/local/cuda-11.3/include/
sudo chmod a+r /usr/local/cuda-11.3/include/cudnn_version.h

并使用如下指令查看cudnn版本

cat /usr/local/cuda-10.1/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

切换cuda版本

如果有安装多个cuda, 只需修改.bashrc文件中的版本号即可随意切换cuda版本。具体方法见安装cuda一节中的 5. 设置cuda环境变量

参考链接

  1. https://blog.youkuaiyun.com/sss_369/article/details/94591280
  2. https://blog.youkuaiyun.com/wanzhen4330/article/details/81699769
  3. https://zhuanlan.zhihu.com/p/35834028

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

<think> 我们正在讨论的是在Ubuntu系统上全局安装CUDAcuDNN之后的额外配置步骤。用户已经完成了CUDAcuDNN安装,现在需要知道还需要进行哪些配置以确保环境正常工作。 在安装CUDAcuDNN之后,通常还需要进行以下配置: 1. 设置环境变量:将CUDA的binlib路径添加到系统环境变量中,以便系统能够找到CUDA相关的命令库。 2. 验证安装:通过运行一些示例程序或简单的命令来验证CUDAcuDNN安装是否成功。 3. 安装配套的NVIDIA驱动(如果需要):有时安装CUDA版本可能需要特定版本的驱动,需要检查驱动版本是否兼容。 4. 配置多版本管理(可选):如果系统中存在多个CUDA版本,需要配置如何切换使用哪个版本。 由于用户提到的是“全局环境”,因此我们应该考虑系统级别的配置。 具体步骤: 1. 设置环境变量: 通常,安装CUDA后,CUDA会被安装在`/usr/local/cuda`(这是一个符号链接,指向具体安装版本,例如`/usr/local/cuda-11.6`)。我们需要将以下路径添加到环境变量中: - 将`/usr/local/cuda/bin`添加到`PATH`中,这样可以在任何地方使用`nvcc`等命令。 - 将`/usr/local/cuda/lib64`添加到`LD_LIBRARY_PATH`中,这样程序在运行时可以找到CUDA的库。 修改`/etc/profile`文件(全局配置)或用户级别的配置文件(如`~/.bashrc`或`~/.profile`)来永久设置环境变量。例如,在`/etc/profile`中添加: ``` export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH ``` 然后执行`source /etc/profile`使配置立即生效(或者重新登录)。 2. 验证CUDA安装: 编译并运行CUDA示例程序,例如`deviceQuery`或`bandwidthTest`,这些示例通常位于`/usr/local/cuda/samples`目录中。具体步骤: - 进入示例目录:`cd /usr/local/cuda/samples` - 编译示例:`sudo make`(可能需要安装build-essential) - 运行`bin/x86_64/linux/release/deviceQuery`,如果看到输出显卡信息,则CUDA安装成功。 3. 验证cuDNN安装: 由于cuDNN是库文件,可以通过检查头文件库文件来验证。通常,cuDNN的文件会被复制到CUDA安装目录中(即`/usr/local/cuda`)。可以检查: - 头文件:`/usr/local/cuda/include/cudnn.h` - 库文件:`/usr/local/cuda/lib64/libcudnn.so*` 另外,也可以使用一个小程序来测试cuDNN是否正常工作,例如一个使用cuDNN的简单卷积程序。 4. 驱动版本检查: 使用`nvidia-smi`命令查看驱动版本,并确保该驱动支持安装CUDA版本CUDA Toolkit的版本与驱动版本兼容性可以在NVIDIA官网上查到。 5. 多版本管理(如果有多个CUDA版本): 如果安装了多个CUDA版本,可以通过更改`/usr/local/cuda`符号链接指向的版本切换。例如: ``` sudo rm /usr/local/cuda sudo ln -s /usr/local/cuda-11.6 /usr/local/cuda ``` 然后更新环境变量(如果之前已经设置过环境变量指向`/usr/local/cuda`,则无需修改环境变量文件,只需重新加载)。 注意:在修改环境变量后,可能需要重启终端或者使用`source`命令使更改生效。 此外,如果用户需要编译使用CUDA的程序,还需要安装相应的开发工具(如gcc、g++)依赖库。 根据上述内容,我们将分步骤详细说明。 </think> 在 Ubuntu 全局环境安装 CUDA cuDNN 后,还需完成以下关键配置确保环境正常工作: ### 1. **环境变量配置** 编辑全局配置文件(需`sudo`权限): ```bash sudo nano /etc/profile ``` 在文件末尾添加: ```bash export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH ``` 保存后执行: ```bash source /etc/profile ``` ### 2. **CUDA 安装验证** ```bash nvcc --version # 检查CUDA编译器 cat /usr/local/cuda/version.txt # 查看CUDA版本 ``` ### 3. **cuDNN 安装验证** ```bash cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2 # 检查cuDNN头文件 ldconfig -p | grep cudnn # 验证库文件链接 ``` ### 4. **关键符号链接创建** 防止应用找不到库文件: ```bash sudo ln -s /usr/local/cuda/lib64/libcudart.so /usr/lib/libcudart.so sudo ln -s /usr/local/cuda/lib64/libcudnn.so /usr/lib/libcudnn.so sudo ldconfig # 更新动态链接器缓存 ``` ### 5. **NVIDIA驱动兼容性检查** ```bash nvidia-smi # 查看GPU状态 cat /proc/driver/nvidia/version # 核对驱动版本 ``` 确保驱动版本≥[CUDA Toolkit要求](https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html)[^1] ### 6. **测试样例程序** 编译CUDA示例验证功能: ```bash cd /usr/local/cuda/samples sudo make -j$(nproc) # 全核心编译 ./bin/x86_64/linux/release/deviceQuery # 运行设备查询 ``` 成功输出应包含`Result = PASS` ### 7. **多用户环境配置** 通过`/etc/environment`添加全局路径: ```bash sudo nano /etc/environment PATH="/usr/local/cuda/bin:原有路径" LD_LIBRARY_PATH="/usr/local/cuda/lib64:原有路径" ``` ### 常见问题排查 - **库文件缺失错误**:重做步骤4的符号链接 - **`nvcc`命令未找到**:检查步骤1的`PATH`配置 - **驱动不兼容**:通过`sudo apt install nvidia-driver-5xx`更新驱动(替换5xx为所需版本) > 提示:深度学习框架(如PyTorch/TensorFlow)需通过`conda install cudatoolkit=xx.x`指定匹配的CUDA版本[^2]。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值