如果你要也要安装caffe,建议先安装caffe
滴滴云的GPU云可以用了,冲着3元一小时的价格,我去试了一把。
1、好吧,先注册滴滴云,这个简单略过。
2、要购买GPU实例,先要实名认证,要上传身份证的正反面,JPG格式,好吧,我上传,在下班时间里居然秒通过,话说这不是人为审核吧,我估计乱传一张身份证也会通过。
3、开始购买了啦,发现可用地区有且只有广州一区和广州二区,难道滴滴服务器只在广州吗,难道是根据我的地区自动选择的(深圳,不知其它的人是不是更多选择),没有譬如香港之类的地区,这就造成我们的服务器天然上不了类似google的网站,不巧的是tensorflow正好是google的。
GPU服务也是有且只有一个p4
镜像有两个右上角有GPU的,我们选个Ubuntu吧
付费我是按时发费
选择最低配置
选择带宽1M的话是0.03元每小时(按小时收费哦),开始配置服务器时应该要分配大一点,因为肯定要下载一些环境之类的。
最后再设一下密码(用户名固定为dc2-user):(这里可以设置ssh key连接方式)
好吧,最后用微信付款3.03元(1M带宽),申请到如下配置的GPU服务器一个小时的使用时间
可以看出来,收费主要有三项,一个是镜像占有空间收费(20G内免费,我们现在还没有创建镜像),实例收费,带宽收费。
注意点:
当你创建完实例以后,系统就开始收钱喽,如果你不想让它收钱要怎么办,你可能会认为把实例关机就不收钱了,答案是错的,你得把这个实例删除,删除哦,当你把实例删了以后,发现宽带还在收钱哦,你还要把宽带也删了哦,也就是说当你不想付钱时,你要手动分别删除两个项目实例和带宽哦。你又会说了,我好容易配好的环境训练一次,删了以后,后面再用又要再配环境,那不是晕了,所以你在删除之间先做个镜像,然后删除实例和网络。后面再用的时候,再创建实例的时候选择这个自己的镜像,就可以还原到上次的系统了。
好吧,我们终于建好了实例,有了ssh的帐号和密码,我们在windows上要装个ssh的客户端来登陆吧,常用的应该是winscp+putty吧,要上传下载文件就用winscp,要命令行就用putty,在winscp里可以打开putty,但要先装好putty,并且做一下配置关联起来。(另一种方式使使用ssh设置登录秘钥,linux环境下可直接连接)
putty登陆上去以后,可以发现它已经装好的显卡驱动+cuda(9.0)+cudnn(7.0),但是其它像tensorflow之类都是没有的。
[html] view plain copy
- sudo passwd root
可实现更改root 密码,貌似不改也行,默认可安装东西
如果只是一台训练机,我个人感觉不用担心安全问题,因为训练完我马上关掉,而且在防火墙上默认只开了443,80,22等端口,可以按自己的需求关掉除22外的其它外网端口。
打开putty,使用root连接上实例,先给它装个anaconda先
[html] view plain copy
- wget https://repo.anaconda.com/archive/Anaconda3-5.2.0-Linux-x86_64.sh
- chmod 777 Anaconda3-5.2.0-Linux-x86_64.sh
- sh Anaconda3-5.2.0-Linux-x86_64.sh
按q,然后yes,然后一路按提示yes,最后提示是否加到bashrc,这是需要的。
装完以后运行命令使其生效
source ~/.bashrc
另外cuda的lib也要加到barshrc里,不然后面使用tensorflow时有问题
vim ~/.bashrc
再最后加上
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64
然后按下 :wq 退出保存
看看python装好了没
- python --version
因为我们装了anaconda所有要有效利用起来:
创建tensorflow环境:
conda create -n tensorflow
实际上是针对tensorflow在anaconda文件夹下创建了一个文件夹作为一个独立的环境
然后启用环境:
source activate tensorflow
安装tensorflow gpu版
pip install --ignore-installed --upgrade tensorflow-gpu
满的话后面(tensorflow-gpu)可直接更改为源如:
https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-1.0.1-cp27-cp27m-linux_x86_64.w
安装完成后就完工了!
在该环境下(source activate tensorflow):
测试例子:
import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))
Hello, TensorFlow!
如果要退出环境则输入:
deactivate
参考:
1.https://blog.youkuaiyun.com/wulala789/article/details/80550407
2.https://www.jianshu.com/p/f459f4ab0d99/
认识优秀的硕博大神,打你脱单带你飞