目录
准备说明
1版本对应关系
必须严格安装tensorflow要求对应的python 、cuda、cuDnn版本
否则安装不成功,或者安装成功也可能无法检测到gpu
本教程演示安装的是tensorflow-2.2.0,使用的是python3.7
参照表选择安装cuda10.1 和 cuDnn 7.6.5 和 vs2019
注意:
- 最好准备空余磁盘空间5gb以上
- 目前amd的显卡还不支持安装
2.我的系统环境
操作系统:win10
显卡:GTX1050ti 对应驱动版本:442.50
cuda(按步骤安装完后)10.1 安装在F盘
python环境准备
- 1.安装anaconda3 知乎教程,包括下载链接 + 教程 +避坑
-2.打开anconda Navigator,安装
我使用anaconda 自带的python3.7jupyter notebook 安装完后按钮变为Launch,如下图 。
更新显卡驱动
1.驱动版本要求对照表
根据上表,安装cuda10.1之前显卡驱动版本应该 >= 418.96 (window系统)
2.查看自己的显卡驱动版本
- 方式1 打开控制面板–硬件与声音–NVIDIA控制面板–左下角系统信息 打开如下图
- 方式2 新版本的NVIDIA的控制面板可能不放在系统的控制面板中,而是开始菜单中,直接找就好
如图,我的驱动程序版本为442.50
- 方式3.下载驱动精灵等软件,可以查看版本,下载切换版本更快,选择版本更方便
3.下载更新
- 方式1.到NVIDIA官网手动下载安装
- 方式2.下载驱动精灵等软件,更快,选择版本更方便
安装过程的一开始有个选择路径的地方,默认即可,因为安装完成后该路径会被自动删除。其他都是直接过过过。
安装cuda
-
官方网站下载cuda10.1 并打开。
文件比较大 2.0gb,下载比较慢可以将下载按钮复制它的链接到迅雷打开,速度会提升哦! -
extraction path默认就可以,因为安装完后该路径会自动删除。
-
自定义安装
- 安装位置 --保持默认,若珍惜c盘的空间可以选择别的盘新建文件夹,但是一定要记住自己安装在哪!!我的安装在了F盘,记住它,后面设置环境变量很重要。
- 设置环境变量
这步也是非常重要!
右键我的电脑–属性–高级系统属性设置
点击环境变量–双击path–新建以下路径(到你安装cuda的地方copy对应的路径粘贴即可)
若你是默认安装路径,则复制粘贴
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib\x64;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\include;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\CUPTI\libx64;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\libnvvp;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib;
tips:cuda可以多版本共存,若之前安装过其他版本cuda且本人有洁癖,在控制面板的应用卸载界面把所有带有cuda命名的程序卸载,再安装新版本cuda即可!
安装cudnn
- 下载链接 ——下载时需要注册,注册了就好!免费!
- 是一个压缩包,把压缩包解压后将cuda文件夹中所有文件、文件夹复制粘贴到刚刚你安装cuda文件夹中。若果你是默认路径则为
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1
tips:直接全选复制就可,因为没有没有文件覆盖 。
解压,全选,右键,复制
来到cuda安装路径,右键,粘贴
- 重启!完成!
环境检查+tensorflow安装
- 这部分可以直接交给jupyter notebook
下载我的notebook 链接:https://pan.baidu.com/s/1CxH6FfV1_FxG2brJkDTOAQ
提取码:1234
此步骤可选,包括环境检查、tensorflow安装、gpu检测、使用gpu跑模型训练等内容
选择这步,后续的步骤就是重复的啦,可以直接跳过,若不选择此步骤,则需要完成以下步骤
部分内容截图:
1
cuda安装检查
- 打开cmd,输入
nvcc --version
正确输出:
安装tensorflow
安装tensorflow2.2.0,直接pip,tensorflow2.0以上版本已经包括cpu,gpu版本,但是两条指令一起运行也不影响,他会提示你包已经存在。
tips:一定要使用镜像-i https://pypi.tuna.tsinghua.edu.cn/simple ,如果你是性子很好、网速好到爆炸,当我没说
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow==2.2.0
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==2.2.0
gpu是否被检测
import tensorflow as tf
print(tf.config.list_physical_devices('GPU')) #有的电脑不只一个,安装错误为空
print(tf.test.gpu_device_name()) #表示正在使用的gpu
print(tf.test.is_gpu_available())+
gpu使用情况
cmd输入: -----查看gpu占用情况等等
nvidia-smi
其他问题
Q1.官网下载cudnn、cuda过慢
A1:
链接:https://pan.baidu.com/s/1HqTg-ks1XkUCrmlvcEnh1A 提取码:1234
Q2.cuda,cudnn是什么?
A2:
cuda是Compute Unified Device Architecture的缩写,为了让GPU可以不仅仅工作与自己的一幕三分地,而是利用自身的优势,完成通用计算的任务。
NVIDIA CUDA® 深度神经网络库 (cuDNN) 是经 GPU 加速的深度神经网络基元库。cuDNN 可大幅优化标准例程(例如用于前向传播和反向传播的卷积层、池化层、归一化层和激活层)的实施。
借助 cuDNN,研究人员和开发者可以专注于训练神经网络及开发软件应用,而不必花时间进行低层级的 GPU 性能调整。
Q3.我的电脑之前已经安装过了tensorflow2.0+,我在安装完cuda,cudnn后tensorflow仍然检测不gpu?
A3:
保证cuda、cudnn的版本要跟你的python版本、tensorflow版本、gpu驱动版本匹配(参考教程两张关系对应图)
若你是安装cudnn、cuda之后不重启就运行tensorflow代码会检测不到gpu,应重启!
欢迎提问!继续补充完善!