之前用另win10下安装pytorch 1.8_SOT3513909404的博客-优快云博客一个小号写过一些类似文章,这次想合并下。
win10下安装pytorch 1.8_SOT3513909404的博客-优快云博客
Windows配置Paddle(Pip安装)_SOT3513909404的博客-优快云博客
0.使⽤ nvidia-smi 命令查询显卡驱动是否正确安装
1. CUDA安装
根据自己的需求选择版本,英伟达官网下载地址 ,本文使用的CUDA10.2
如果你使用的是安培架构的GPU,推荐使用CUDA11.2。
如果你使用的是非安培架构的GPU,推荐使用CUDA10.2,性能更优。
2. cuDNN
2.1 下载cudnn时,会要求注册,由于官网很卡顿,多次注册都失败,所以这里直接打开下载链接 cudnn. 然后在需要下载的条目里右击,复制下载链接,然后在迅雷中下载。参考文章
2.2 安装&配置cudnn,是按照官网要求做的https://docs.nvidia.com/deeplearning/cudnn/install-guide/#install-windows
3. 添加环境变量Path
需要手动添加如下路径,对应上一步的安装路径
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\include
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\extras\CUPTI\lib64
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.2\bin\win64
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.2\common\lib\x64
4. 测试是否成功
4.1然后输入nvcc -V查看
4.2 cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\extras\demo_suite
输入执行bandwidthTest.exe 和deviceQuery.exe
5.Pytorch安装
4.1 pytorch whl镜像地址
4.2 更加推荐此种方式,由于pypi没有找到0.7.0 cuda版本的torchvision 因此在这里下载
笔者此处安装的是pytorch==1.6 。后来装了K40c(sm35),因pytorch算力支持3.5以上的,所以需要降低pytorch版本
#下载后离线安装
conda install --offline pytorch-1.8.1-py3.8_cuda10.2_cudnn7_0.tar.bz2
再安装相应的torchvision==0.7.0、opencv-python==4.2.0.32, tensorboard==1.15.0
#测试
import torch
print(torch.cuda.is_available())
6. tensorflow安装
5.1. 首先确认python cuda tf 的版本关系,参见官网(windows环境下)。
5.2. 安装tensorflow_gpu-2.1.0版本
由于cuda是10.2,根据官网的解释是不兼容的。需要如下操作:
把cuda安装目录bin文件夹下的cudart64_102.dll文件复制一份重命名为cudart64_101.dll
#测试
import tensorflow as tf
print("tf version:", tf.__version__)
print(tf.test.is_gpu_available())
Tip
推荐conda安装,官网地址