Linux&Nvidia显卡驱动, cuda工具包,驱动包版本记录

0. 情况说明

Ubuntu关于显卡驱动,nvcc显示的cuda工具包版本,显卡驱动可以支持cuda驱动包的最高版本,Pytorch实际使用的cuda版本等等非常乱…

首先,我们需要理清楚CUDA版本之间的关系以及它们如何与PyTorch和系统驱动配合。

  • PyTorch的cu118表示它是用CUDA 11.8编译的。
  • 那为什么nvcc --version显示的是10.1呢?这可能是因为系统中有多个CUDA版本,而nvcc指向的是旧版本。
  • CUDA工具包和驱动程序之间有什么关系呢?
    • CUDA有两个主要部分:驱动程序和工具包。驱动程序由NVIDIA的显卡驱动提供,而工具包包括nvcc等编译工具。可能我安装的CUDA工具包版本是10.1,而显卡驱动支持更高的CUDA版本。比如,显卡驱动版本决定了支持的最高CUDA工具包版本。比如,如果驱动是535,可能支持CUDA 12.x。那我的显卡驱动版本是多少呢?可以通过nvidia-smi查看,右上角显示的CUDA版本应该是驱动支持的最高版本。

1. 确认驱动支持的CUDA版本


在Ubuntu系统上管理多个CUDA版本时,需理清驱动支持、工具包版本和环境变量配置的关系。以下是分步解决方案:

nvidia-smi

查看右上角的 CUDA Version,例如显示 12.4,表示驱动支持最高到CUDA 12.4的运行时。PyTorch使用的CUDA运行时基于驱动,而nvcc版本是工具包编译版本。


2. 检查已安装的CUDA工具包

ls /usr/local | grep cuda

输出可能包含 cuda-10.1、cuda-11.8、cuda-12.4 等。若已安装所需版本(如11.8或12.x),直接跳到步骤4配置环境变量;否则继续安装。


3. 安装所需的CUDA工具包

假设需要安装 CUDA 11.8(对应PyTorch的cu118)或 CUDA 12.x:

访问 CUDA Toolkit Archive,在官方网址下载对应版本(如11.8.0)。
关闭图形界面,运行安装:

sudo sh cuda_11.8.0_520.61.05_linux.run

安装时取消勾选驱动安装(保持现有驱动),仅安装工具包。

4. 配置环境变量

方法1:

在 ~/.bashrc 中设置路径指向新版本(例如CUDA 11.8):

export PATH=/usr/local/cuda-11.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH

生效配置:

source ~/.bashrc

有可能直接在安装run文件的时候就会帮助创建好symbol link

方法2(推荐):

在/usr/local路径下设置cuda的软连接指向具体版本,在~/.bashrc中统一使用
设置软连接:

sudo ln -s /usr/local/cuda-11.8 ./cuda

~/.bashrc设置:

export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}

生效配置:

source ~/.bashrc

5. 验证工具包版本

nvcc --version

此时应显示新安装的版本(如11.8)。若仍显示旧版本,检查路径是否正确,或使用 which nvcc 确认调用的位置。


6. 安装依赖库

配置正确CUDA版本后,重新安装目标库:

pip install your_library

若库需要编译,确保其检测到新的nvcc版本。


7. 管理多版本(可选)

使用 update-alternatives 管理多版本:

sudo update-alternatives --install /usr/bin/nvcc nvcc /usr/local/cuda-11.8/bin/nvcc 100
sudo update-alternatives --config nvcc

选择对应的版本编号即可切换。


8. 关键点总结

驱动版本决定支持的最高CUDA运行时(nvidia-smi显示的版本)。
工具包版本(nvcc)需通过安装并配置环境变量指定。
PyTorch基于驱动支持的CUDA运行时运行,但编译库依赖nvcc版本。
按此流程调整后,即可解决CUDA工具包版本过低的问题。

### LinuxNVIDIA 显卡驱动CUDA cuDNN 的安装教程 #### 1. 安装 NVIDIA 显卡驱动 在 Ubuntu 上安装 NVIDIA 显卡驱动可以通过图形界面完成,也可以通过命令行操作。推荐方法如下: - 打开 *软件更新* 中的 *附加驱动* 页面,在可用选项中选择带有 `NVIDIA` 字样的驱动程序并应用更改[^2]。 如果需要手动安装或者禁用默认的 Nouveau 驱动,则可以执行以下步骤: ```bash sudo apt update sudo apt install linux-headers-$(uname -r) sudo modprobe -r nouveau && sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nouveau.conf" sudo reboot ``` 重启后下载对应版本NVIDIA 驱动包,并运行安装脚本[^3]: ```bash chmod +x NVIDIA-Linux-x86_64-version.run sudo ./NVIDIA-Linux-x86_64-version.run ``` #### 2. 升级或安装 CUDA 工具包 为了确保兼容性性能优化,建议先确认已安装的 NVIDIA 驱动版本是否支持目标 CUDA 版本。 对于特定版本CUDA 10.1 可以按照官方文档说明进行配置[^1]。通常情况下可通过 APT 或者本地 RUN 文件两种方式实现安装过程。APT 方法较为简便: ```bash wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntuXX/x86_64/cuda-keyring_1.0-1_all.deb sudo dpkg -i cuda-keyring_1.0-1_all.deb sudo apt-get update sudo apt-get -y install cuda-10-1 ``` 完成后记得设置环境变量以便后续调用工具链正常工作: ```bash export PATH=/usr/local/cuda-10.1/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PATH source ~/.bashrc ``` #### 3. 配置 cuDNN 库文件 cuDNN 是针对深度学习框架加速而设计的一套高性能库集合。其依赖于基础 CUDA 平台之上构建而成。获取合法授权后的 cuDNN 压缩档需解压到指定目录下覆盖原有内容: 假设当前路径存在 tar.gz 形式的压缩包形式: ```bash tar zxvf cudnn-X-linux-x64-vY.Y.ZZ.tgz sudo cp cuda/include/cudnn*.h /usr/local/cuda/include/ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn* ``` 最后验证整个流程无误可尝试编译示例项目来检测功能完整性。 ```python import tensorflow as tf print(tf.test.is_built_with_cuda()) # 输出 True 表明成功启用GPU计算能力 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值