附录001《 FloydHub 的入门教程》

文档:《 FloydHub 的入门教程》
作者:燕志伟
时间:2020-03-02
版权:原创

前言

Floydhub 网站的组织结构与文档逻辑写得有些零碎,且分散在多处,对初学者不太友好,所以,我写这个简单的入门教程,抛砖引玉。

注册一个帐号

  1. 在官网 https://www.floydhub.com/ 注册一个账号。
  2. 免费的资源只有CPU只有2小时,用途不大。收费的GPU有两种:
TypePriceGPURAMSSD
Standard GPU1.2 $/HourTesla K80 12GB61 GB100 GB
High Performance GPU4.2 $/HourTesla V100 16GB61 GB100 GB

注意:GPU的板上内存大小与RAM大小有限。如果模型太大,训练开始时,就会报错终止,所以最好先要估计一下内存的使用量。

安装Floyd命令行软件包

  1. 打开一个终端
  2. 使用Python pip 安装 floyd-cli
pip install floyd-cli

上传训练及测试数据集

  1. 「网页操作」先用浏览器在网页登录帐号myAccount
  2. 「网页操作」在Datasets页面新建数据集,并为数据集起个名字,如cartoon_images
  3. 「PC终端操作」登录,关联PC本机目录my_local_images与远程目录myAccount/cartoon_images,上传本机目录中所有文件到远程目录。注意,应提前组织好本机的目录结构。
$ floyd login 
$ cd my_local_images; floyd data init myAccount/cartoon_images
$ floyd data upload 

在upload 期间如果中断了,下次可用 floyd data upload -resume 断点续传。

新建一个Project

  1. 「网页操作」先用浏览器在网页登录帐号myAccount
  2. 「网页操作」在Projects页面新建一个项目,并为新的项目起个名字,如gan_cartoon

使用floyd的计算资源进行训练

  1. 在PC机上,先准备好自己的模型文件main.py (Python文件),并拷贝到一个新建的空目录中gan_model去。
  2. 「PC终端操作」,使用命令在远端Floyd服务器上运行一个计算任务。
$ cd gan_model
$ floyd run \
 --gpu \
 --env tensorflow-1.9 \
 --data myAccount/datasets/cartoon_images/1:dataset \
 --follow "python main.py --phase train --dataset alimages --epoch 1  --iteration 2 --light True"

–gpu 指定使用GPU;
–env 参数指定tensorflow的版本;
–data 参数是映射刚建好的训练集目录名(在WEB页面中找)到本次任务的训练目录名(即在model.py 源代码中使用的数据集目录名),使用冒号分开。如果有多个目录名需要映射,–data 可以重复使用多次。
–follow 参数就是实际在floyd的一个Linux的虚拟机上使用的训练命令了。例子中,只是我在训练过程中使用的命令。大家可以根据自己在本机运行的情况,写自己的训练命令。

注意,在gan_model目录中不要放其它无关文件,因为此目录中的所有文件和目录都会被命令 floyd run 上传到远端。另外,在例子中第 5 行最后一个单词所指的远端目录名dataset会在训练时映射为 /dataset 在根目录下,注意在训练脚本中修改相应的路径。

训练结束下载结果数据

  1. 「网页操作」在网页上找到这个JOB的全称 myAccount/projects/gan_cartoon/17
  2. 「PC终端操作」打开一个终端,输入下面的命令下载结果数据。
$ mkdir train_result_backup
$ cd train_result_backup
$ floyd init gan_cartoon %关联项目名字到当前目录
$ floyd data clone myAccount/projects/gan_cartoon/17  %下载本次JOB的所有文件

总结

在Floydhub 的运行训练命令的基本步骤与本地PC机上运行本质上是一样的。但是,其用WEB网页及本地命令行floyd-cli两个工具来管理和衔接整个过程,会让人在两个工具之间不断地切换来完成整个训练或计算过程。这个过程对用户其实并不友好。当前,不少的云资源都会采用类似方式,希望大家注意这个问题。

(END)

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值