目录
背景
之前没有在Windows上用自己电脑的显卡跑过机器学习,因为感觉Windows很麻烦而且问题很多。一直是在Linux下GPU服务器上跑的。
机缘巧合下要去配Windows的tensorflow环境,还是很害怕这种事情的。但是还是去试一试了。
三种方式让tensorflow代码在windows上跑起来:
- windows装环境,可能长期来看调试比较麻烦,大部分还是linux服务器比较好弄,短期没问题;
- 租阿里云腾讯云gpu服务器然后在上面弄;
- 下载一个比如ubuntu虚拟机,安装anaconda然后把之前配过的conda环境拷贝过来。
这篇文章发生的所有事情大概占了两个凌晨和半个下午。
遇到的问题包括但不限于图像的维度问题、灰度问题、tensorflow安装的过程、cuda&cudnn选择、显卡爆满无法计算,等。
在Windows上配环境
1. 配tensorflow1.13环境
安装tensorflow并且去跑机器学习算法最关键的是各个版本的cuda和cudnn要兼容,否则就会寄掉。
可以参考:2021最新:TensorFlow各个GPU版本CUDA和cuDNN对应版本整理(最简洁)_cuda12.1对应的tensorflow-优快云博客
我这一套配置是这样的:
python3.6.13
tensorflow1.13.1
cuda10.0
cudnn7.6.5(本来想用7.4,因为是经过验证的可适配,但是一下子没有合适的channel提供这个版本,也不想自己手动官网下载)
创建新conda环境
已经安装好了anaconda的环境,直接启动prompt。
conda create -n tensorflow1.13 python=3.6.13
conda activate tensorflow1.13
安装cuda
更新pip
python -m pip install --upgrade pip
装cuda
conda install cudatoolkit=10.0
安装cudnn
本来其实想装7.4的,结果默认的channel里没有。
于是搜一下有啥
conda search cudnn -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/linux-64/
发现cudnn7.6.5也可以适配cuda10.0,就试一试了。