虽然知道linux下bug更少,但是就是要在win10上用,也感谢网上的各种攻略,终于解决了各种坑,在此写一篇攻略,回馈一下社会。
系统: windows10
显卡: 技嘉1080Ti
Pycharm + Anaconda + python 3.6
首先,下载Pycharm, Anaconda 和python3.6是最基本的, 几乎没有坑。 由于之前已经用tensorflow 的cpu版本做过一段时间的深度学习了,因此这些是我在从CPU转到GPU时已经打好的基础。
接下来安装显卡。 由于实验室电脑之前是极其落伍的630显卡, 换成1080Ti后也更换了一波电源风扇机箱主板,总共花了1600 (不算显卡的5800)。 安装显卡叫了上门服务,以免自己失误装错了。
1. 首先安装CUDA 9.0.
因为说是tensorflow 目前还是支持CUDA9.0, 因此也没有下载10.0版本,并不知道tensorflow 1.11 是否支持CUDA10.0, 但是9.0是可以成功跑通的。
下载地址如下:
注意: 这里一定用选local 版本,否则会有各种安装错误。我主要就是卡在了这里。
大概是1.4GB左右。 后面的补丁我没有下载,但也跑通了,准备今晚去下载试试。
因为一开始我都用的network版本,导致一直安装出错,但期间我也做了一些调整:
下载了VS2017版本, 用DDU软件在安全模式下清楚了英伟达最新驱动, 下载了一个较早版本的驱动。
比如 百度搜索 388.13-desktop-win10-64bit-international-whql.exe , 可以得到这个版本的驱动。
由于没有控制变量,不知道最后的成功是基于哪一步,反正如果都做了的话是可以跑通的。
配置CUDA环境变量, 下载CUDNN部分完全参照
https://blog.youkuaiyun.com/lcb_coconut/article/details/79228759
一文的攻略。 也不知道是不是标准答案,但我确实跑通了。 在此表示感谢。
最后, 通过pip或者pycharm 卸载tensorflow包,下载tensorflow-gpu包。
代码可以完全不变。
直接运行即可!
注:一开始跑了个程序,发下GPU利用率才10%, 以为有什么坑还没发现,后来修改复杂的网络模型(其实就是增加了神经元个数),就跑到了80%以上,可能是对于小规模网络,杀鸡焉用牛刀吧!
谨以此文,献给windows下踩坑的同学们。。