Ubuntu18.04下安装pytorch步骤&多cuda版本共存(啰嗦版)

本文详细介绍了在Ubuntu系统上安装CUDA、cuDNN以及PyTorch-GPU的步骤,包括显卡驱动的安装、CUDA和cuDNN的版本选择与安装,以及如何通过Anaconda创建虚拟环境安装PyTorch。文章强调了安装过程中要注意的版本兼容性、驱动安装方法,以及如何检查安装是否成功。此外,还提供了卸载CUDA的参考链接和多版本CUDA环境的配置方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

1.知识补充

【机器学习】显卡、GPU、NVIDIA、CUDA、cuDNN(搬运:要点如下,详细可看链接)

加 * 非重要内容,视情况执行。

显卡:即显示卡,全称显示接口卡,是计算机最基本配置、最重要的配件之一(就像联网需网卡,数据显示在屏幕需显卡)。显卡是由GPU、显存等等组成的。

GPU:图形处理器,一般焊接在显卡上的。GPU是显卡上的一块芯片,就像CPU是主板上的一块芯片。GPU功能强大,只用于图形处理太浪费,NVIDIA公司提出CUDA的概念,通用并行计算架构,是一种运算平台,更加方便利用GPU强大的计算能力(并非所有GPU支持CUDA)。

CUDA:通用并行计算架构,该架构使GPU能够解决复杂的计算问题。(加加速-我的理解)

cuDNN:(只是cuda的扩展工具而已)是CUDA在深度学习方面的应用。使得CUDA能够针对性的应用于加速深度神经网络。

2.安装说明

1.如果没有显卡,直接 1 与 3 即可,途中标颜色即建议步骤,只有 2.2.2 较为复杂;

2.所有安装包,都可以备份 U 盘,下次可以直接使用;

3.笔者认为cuDNN 只是 cuda 扩展工具,下载了对应 cuda的 cuDNN,复制 cuDNN 文件到 cuda 即可。所以安装步骤放 cuda 中的一个小点,没必要作为一个大标题。

1、Anaconda的下载安装

搬运:Ubuntu18.04下安装Pytorch-GPU(超详细自己安装全过程)

1.1 下载

最新版本:Anaconda官网下载

历史版本:Anaconda历史版本

下载过慢:Anaconda清华源下载

其实可以将安装文件保存 U盘 ,下次安装可以直接使用_cuda/cuDNN 也是如此

1.2 安装

1. 终端运行下载 .sh 文件:

bash Anaconda3-(下载文件 Tab 补全即可)-Linux-x86_64.sh

2.过程

Welcome to Anaconda3 5.0.1
 
In order to continue the installation process, please review the license
agreement.
Please, press ENTER to continue
>>> 按回车
#然后一直按回车到协议完毕
#出现:
Do you accept the license terms? [yes|no]
>>>输入yes
#下面就是问你安装目录,建议就是默认的安装路径,直接按回车
Anaconda3 will now be installed into this location:
/home/mayunteng/anaconda3
 
  - Press ENTER to confirm the location
  - Press CTRL-C to abort the installation
  - Or specify a different location below
 
[/home/mayunteng/anaconda3] >>> 按回车
#接下来就是等待安装完成
#注意安装完成以后会询问你是否把anaconda3的路径加到环境变量里去,一定要选yes,一定要选yes,一定要选yes。

*1.3 添加环境变量(1.2默认则不需要执行)

1.2 默认路径添加环境变量,新开终端出现会出现 (base),表明已经成功添加环境路径,则无需执行以下代码。

sudo gedit ~/.bashrc
# 在文件末尾处添加以下语句
export PATH=/home/XXX/anaconda3/bin:$PATH    XXX为自己的用户名
source ~/.bashrc

终端输入python,可以看到有Anaconda出现,安装成功。

2、安装cuda(cuDNN是配套的)

 在安装之前你要先查看你的电脑是否支持GPU运算,否则你也不用安装了。

2.1 NVIDIA驱动安装

平常使用 2.1.1 两行命令安装就可以了,实在安装有问题可以尝试 2.1.2。

2.1.1 命令自动安装

      Ubuntu18.04中自带了NVIDIA驱动,但没有完整安装,使用命令ubuntu-drivers devices(若不显示,sudo apt update更新源)可查看当前的设备和驱动。

ubuntu-drivers devices

sudo ubuntu-drivers autoinstall #安装所有驱动 
sudo apt install nvidia-440 #只安装其中一个驱动 

sudo nvidia-smi #验证是否成功

*2.1.2使用官方的NVIDIA驱动进行手动安装(稳定、靠谱)

*下载 cuDNN 没注意,显卡驱动自动降版后,自动安装装不上,使用手动安装成功解决。

(纯纯的搬运工,主要真的有用,怕作者哪天删除了)

参考链接:Ubuntu18-22.04安装和干净卸载nvidia显卡驱动——超详细、最简单

<
&lt;think&gt;好的,我现在需要回答用户关于CUDA 11.1兼容的TensorFlow本的问题。首先,我需要确认用户的需求是什么。他们想知道哪个TensorFlow本与CUDA 11.1兼容,可能需要安装或升级他们的深度学习环境。 接下来,我应该回忆TensorFlow和CUDA本之间的对应关系。通常,TensorFlow的每个本都有特定的CUDA和cuDNN本要求。例如,TensorFlow 2.x通常需要特定本的CUDA,比如2.5.0可能需要CUDA 11.2,而早期本可能支持CUDA 11.1。用户提到的是CUDA 11.1,所以需要找到支持这个本的TensorFlow本。 根据我的知识,TensorFlow 2.4.0及之前的本可能支持CUDA 11.0,而2.4之后的本可能开始支持CUDA 11.2。但可能需要具体查看官方文档。例如,TensorFlow 2.3.0支持CUDA 10.1,而2.4.0可能需要CUDA 11.0。可能用户需要查看TensorFlow的发布说明或者官方安装指南。 另外,用户提供的引用中提到了CUDA Toolkit本调整的问题,比如引用[1]提到如果11.2不可用,可以调整到11.3。这可能意味着用户的环境可能有CUDA本的限制,需要找到对应的TensorFlow本来匹配他们的CUDA 11.1。 另外,引用[2]中提到关于驱动本的问题,可能用户遇到了一些兼容性问题,比如驱动本过低,所以也需要考虑驱动本是否满足TensorFlow和CUDA的要求。 现在我需要确认具体的本对应关系。例如,TensorFlow 2.5.0需要CUDA 11.2,而TensorFlow 2.4.0可能需要CUDA 11.0。但可能有某些本支持CUDA 11.1。或者用户可能需要使用较旧的TensorFlow本,比如TensorFlow 2.3或2.4的某个子本,来支持CUDA 11.1。 查找资料的话,官方TensorFlow文档中会有每个本所需的CUDA和cuDNN本。例如,在TensorFlow 2.4.0的安装指南中,可能说明需要CUDA 11.0,而TensorFlow 2.3.0需要CUDA 10.1。但用户需要的是CUDA 11.1,可能属于中间本,是否有对应的TensorFlow本? 或者,可能用户需要安装TensorFlow 2.4.x,但使用CUDA 11.1,但官方可能只支持特定的CUDA本。例如,可能TensorFlow 2.4.1需要CUDA 11.0,而CUDA 11.1可能不被官方支持。但有时候,即使CUDA本稍高,可能也能兼容,但存在风险。 另一种可能性是,用户可能需要从源代码构建TensorFlow以支持CUDA 11.1,但这对大数用户来说比较复杂。因此,建议用户寻找官方支持的本。 另外,用户可能安装CUDA 11.1,但无法升级或降级,所以需要找到对应的TensorFlow本。例如,是否存在某个TensorFlow本官方声明支持CUDA 11.1? 查阅资料后发现,TensorFlow 2.5.0需要CUDA 11.2,而TensorFlow 2.4.0需要CUDA 11.0。那么CUDA 11.1可能没有被官方支持的TensorFlow本。但是,可能有社区提供的本或者某些补丁本支持。 或者,可能用户需要安装较旧的TensorFlow本,如2.3.x,但对应的CUDA本可能更低。例如,TensorFlow 2.3.0需要CUDA 10.1,这可能不符合用户的需求。 这个时候可能需要建议用户检查他们的CUDA本是否正确,或者考虑升级CUDA到官方支持的本,如11.2或11.3,然后安装对应的TensorFlow本。 但用户可能坚持使用CUDA 11.1,这时候需要查找是否有非官方的支持或者是否有变通办法。例如,是否存在用户通过调整环境变量让TensorFlow运行在CUDA 11.1下,尽管官方不支持? 或者是否存在TensorFlow的某个测试或发布候选本支持CUDA 11.1。例如,可能在TensorFlow的GitHub issues或论坛中有相关讨论。 根据我的知识,通常官方支持的本比较严格,所以如果用户必须使用CUDA 11.1,可能需要寻找对应的TensorFlow本。例如,TensorFlow 2.4.0和CUDA 11.0,但用户的是11.1,可能需要查看是否兼容。例如,CUDA 11.1可能向后兼容CUDA 11.0的应用程序,但可能不推荐。 或者,是否存在TensorFlow 2.4.x的某个本支持CUDA 11.1?需要进一步确认。 例如,查阅TensorFlow官方文档,发现TensorFlow 2.4.0要求CUDA 11.0和cuDNN 8.0。而CUDA 11.1可能不被支持。因此,可能用户需要升级到CUDA 11.2或更高本,并安装TensorFlow 2.5.0或更高本。 或者,用户可能安装CUDA 11.1,但TensorFlow可能仍然可以运行,但可能存在兼容性问题。这时可能需要用户尝试安装TensorFlow 2.4.x并查看是否工作。例如,通过pip安装tensorflow==2.4.0,并检查是否能够正确识别CUDA 11.1。 但根据官方文档,这并不被支持,因此可能存在风险。因此,在回答中需要明确说明官方支持的本,并建议用户调整CUDA本以匹配TensorFlow的需求。 另外,用户提供的引用[1]中提到,当CUDA 11.2不可用时,可以调整cudatoolkit本到11.3。这可能意味着用户可能需要通过conda安装特定本的cudatoolkit,而conda可能能够处理依赖关系。例如,安装TensorFlow时,conda可能会自动安装兼容的CUDA工具包本。因此,可能建议用户使用conda安装TensorFlow,并让conda管理CUDA本。 例如,用户可能可以安装TensorFlow 2.6.0,并通过conda自动安装对应的cudatoolkit 11.3,这样无需手动安装CUDA 11.1。这样可能更方便。 总结来说,用户的问题是如何找到与CUDA 11.1兼容的TensorFlow本。根据官方文档,可能没有直接支持的本,但用户可以通过conda安装TensorFlow,并让conda处理CUDA依赖,或者建议用户升级CUDA到支持的本,如11.2或11.3,然后安装对应的TensorFlow本。 此外,用户可能需要参考官方文档中的本对应表,例如TensorFlow官网的安装指南中的&ldquo;Tested build configurations&rdquo;部分,以确认正确的组合。例如,在https://www.tensorflow.org/install/source#gpu 中,可以查看每个TensorFlow本所需的CUDA和cuDNN本。 根据该页面,例如TensorFlow 2.5.0需要CUDA 11.2和cuDNN 8.1,而TensorFlow 2.4.0需要CUDA 11.0和cuDNN 8.0。因此,CUDA 11.1可能没有被任何官方TensorFlow本支持。因此,用户可能需要调整CUDA本到支持的本,如11.0或11.2,并安装对应的TensorFlow本。 如果用户必须使用CUDA 11.1,可能需要寻找非官方构建的本,或者自行从源代码编译TensorFlow,但这对于一般用户来说可能比较困难。 因此,在回答中,应该指出官方支持的本,并建议用户调整CUDA本,或者使用conda来管理依赖关系,避免手动安装CUDA本冲突。&lt;/think&gt;根据官方本兼容性要求,TensorFlow与CUDA 11.1的对应关系如下: 1. **TensorFlow 2.4.x系列** - **官方要求**:CUDA 11.0 + cuDNN 8.0 - **实际测试**:CUDA 11.1可能与TensorFlow 2.4.x部分兼容,但需手动调整环境变量或安装补丁[^1]。 - 安装示例: ```bash pip install tensorflow==2.4.0 ``` 2. **TensorFlow 2.3.x系列** - **官方要求**:CUDA 10.1 + cuDNN 7.6 - **不兼容性**:CUDA 11.1无法直接支持该本。 3. **推荐解决方案** - **升级CUDA**:建议升级到CUDA 11.2或11.3,并安装对应的TensorFlow本: ```bash conda install tensorflow==2.5.0 cudatoolkit=11.2 -c conda-forge ``` - **使用Conda管理依赖**:Conda可自动解决本冲突[^1]: ```bash conda create -n tf_env tensorflow-gpu=2.4.0 cudatoolkit=11.1 ``` 4. **验证安装** 运行以下Python代码检查CUDA是否生效: ```python import tensorflow as tf print(tf.test.is_built_with_cuda()) # 应输出True print(tf.config.list_physical_devices(&#39;GPU&#39;)) # 应显示GPU信息 ```
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值