1、准备数据集
这一步就是想方设法搞来训练数据,可以是图像,可以是语音文件、视频等等。
ok,现在假设你找到了所需的数据集(本教程就以图片为例),数据集需要进行预处理,这部分工作量比较大,需要将庞大的数据集人工分类好。
每个文件夹下就是相应的图片,然后将每一类的图片重命名,切记:不同类的图片要有区别,比如bus类的图片命名为300-399(因为我这里每一类的图片不超过100张,所以用三位数表示,一般命名为六位数数字串),dinosaur类图片为400-499....以此类推,命名完所有类别图片。

本文介绍了使用Caffe进行机器学习训练前的数据准备工作,包括如何组织和命名图像数据集,创建训练集和验证集,以及利用Python脚本生成train.txt和val.txt文件,为后续的模型训练打下基础。
最低0.47元/天 解锁文章
359





