转载请注明作者和出处:http://blog.youkuaiyun.com/john_bh/
1. 概念说明
CUDA(Compute Unified Device Architecture,统一计算架构)
是由NVIDIA所推出通用并行计算架构,该架构使GPU能够解决复杂的计算问题。
NVIDIA cuDNN
是用于深度神经网络的GPU加速库。它强调性能、易用性和低内存开销。NVIDIA cuDNN可以集成到更高级别的机器学习框架。简单的插入式设计可以让开发人员专注于设计和实现神经网络模型,而不是简单调整性能,同时还可以在GPU上实现高性能现代并行计算。
CUDA与cuDNN的关系:
CUDA看作是一个工作台,上面配有很多工具,如锤子、螺丝刀等。cuDNN是基于CUDA的深度学习GPU加速库,有了它才能在GPU上完成深度学习的计算。它就相当于工作的工具,比如它就是个扳手。但是CUDA这个工作台买来的时候,并没有送扳手。想要在CUDA上运行深度神经网络,就要安装cuDNN,就像你想要拧个螺帽就要把扳手买回来。这样才能使GPU进行深度神经网络的工作,工作速度相较CPU快很多。
下载地址:
- CUDA 历史版本下载地址:https://developer.nvidia.com/cuda-toolkit-archive
- CUDA: https://developer.nvidia.com/cuda-downloads
- CUDnn: https://developer.nvidia.com/rdp/cudnn-download,注意,这里需要注册账户;
- Anaconda: https://www.anaconda.com/
2. CUDA
-
下载CUDA toolkit(toolkit就是指工具包),如下图所示,我用的是CUDA 10:
选择后直接下载,大概2.1G。 -
双击安装:
检查系统兼容性,可能需要重启:
兼容性检查完毕,点击同意并继续:
选择自定义,然后下一步:
如果是第一次安装就全部勾选,下一步:
重点提醒:一定要记住这个路径,把这个路径保留下来,后面我们还会用到!!!
重点提醒:一定要记住这个路径,把这个路径保留下来,后面我们还会用到!!!
重点提醒:一定要记住这个路径,把这个路径保留下来,后面我们还会用到!!!
点击下一步:
安装完成,点击关闭:
-
配置环境变量
-
验证安装结果
打开命令行输入: nvcc -Vnvcc -V
安装成功!
3. cuDNN
首先需要注册账号,当然如果有账号直接登录就行。下载完成后,将这个压缩包里的所有文件放到CUDA10安装目录相应文件夹下即可
-
下载 cuDNN
-
解压
-
配置cuDNN
将这三个文件夹的内容复制到之前提示记得三个路径,C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0
,
-
配置环境变量
-
验证
配置完成后,可以验证是否配置成功,主要使用CUDA内置的deviceQuery.exe 和 bandwithTest.exe:
首先win+R
启动cmd,cd到安装目录下的C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\extras\demo_suite
,然后分别执行bandwidthTest.exe
和deviceQuery.exe
,应该得到下图:.\bandwidthTest.exe
.\deviceQuery.exe