tensorflow
参考:https://www.nvidia.com/en-us/data-center/gpu-accelerated-applications/tensorflow/
基础环境需求:
64bit os Linux环境(本人使用centos 7.2 ,Ubuntu环境请参考官网)
python 2.7以上
CUDA8.0以上
cuDNN v6以上
- 安装nvidia驱动和CUDA toolkits,重启。另有一篇博客介绍这两点,不再赘述。
- 设置路径
$ export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
$export
LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
此时要验证是否把基础环境配好,进入到/usr/local/cuda-8.0/samples目录,make一两个程序,跑一下即可。
3.cuDNN安装。
这是将头文件以及相关动态链接库,copy到cuda的头文件五路,以及lib64目录下即可。
$ tar -xzvf cudnn-8.0-linux-x64-v5.1.tgz
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
4 安装tensorflow-gpu。
tensorflow是支持python开发的一个训练框架API,直接使用pip安装即可。
如果是运行 pip install tensorflow,安装的则是cpu版本的。不会使用GPU。
5.安装完成之后,验证是否正确安装了tensorflow环境,可以跑一个helloworld来看看。
如下:$python
在python命令模式下:
$ import tensorflow as tf
$ hello = tf.constant('Hello, TensorFlow!')
$ sess = tf.Session()
$ print(sess.run(hello))
如果执行成功,则恭喜你,tensorflow已经完成了。
如果出现段错误类似的问题,我当时也被该问题搞了半天,后来参考了stackoverflow上面的其他例子,考虑到可能是python包冲突,切换到python虚拟隔离环境,立马就没问题了。
6.训练模型
Tensorflow通过python和C++ API使用,后端通过C++提供核心功能。
cd(tensorflowdirectory) git clone -b update-models-1.0 https://github.com/tensorflow/models
Quick demo。
$ cd (tensorflow directory)/models/tutorials/image/imagenet
$ python classify_image.py
可以测试其他图片集合。
$ python classify_image.py --image_file <path to the JPEG file>
(e.g. python classify_image.py --image_file /tmp/imagenet/cropped_pand.jpg)
CIFAR-10 benchmark
机器学习的通用benchmark。任务目标是分类RGB32*32的图片,图片共十种类型。
$ cd (tensorflow directory)/models/tutorials/image/cifar10
$ python cifar10_train.py
$ python cifar10_eval.py 对结果的评估。