caffe学习笔记(四)--制作自己的数据集train.txt和val.txt,生成LMDB文件

在深度学习的实际应用中,我们经常用到的原始数据是图片文件,如jpg,png,tif等格式的,而且有可能图片的大小还不一致。
我今天尝试制作一个自己的训练数据集,主要步骤为:
1.用MATLAB截图得到训练集的图片
2.生成标签文件列表,即生成 train.txt val.txt 文件
3.将 txt 文件列表中的图像与train图像库、val图像库的图像相连接,生成lmdb格式文件


实验是对一副315×299像素的jpg灰度图片所进行的,我首先用MATLAB截图代码对其进行了三个类别的截图,然后对这三个类别进行15×15的滑动窗口分割,得到了每个类别400张15×15的图片样本,其中200张用作train 100张用做test。
而在caffe中经常使用的数据类型是lmdb或leveldb,如何从原始图片文件转换成caffe中能够运行的db(leveldb/lmdb)文件?
在caffe中,作者为我们提供了这样一个文件:convert_imageset.cpp,存放在根目录下的tools文件夹下。编译之后,生成对应的可执行文件放在 buile/tools/ 下面,这个文件的作用就是用于将图片文件转换成caffe框架中能直接使用的db文件。


1 数据准备

首先在caffe根目录下建立一个文件夹myfile,用于存放数据文件和后面的caffe模型相关文件。
这里写图片描述

然后在myfile文件夹下建立build_lmdb和datatest两个文件夹,其中build_lmdb文件夹用于存放生成的lmdb文件,datatest文件夹存放图片数据。

这里写图片描述

在datatest下主要有2个文件夹和2个.sh文件和2个.txt文件,其中train文件夹中存放待训练的图片,val文件夹中存放待测试的图片,creatlist.sh是分别用来生成train和val的.sh文件,train.txt和val.txt是生成的标签文件。

建立好文件夹后,我们把MATLAB分割好的图片放到train和val文件夹里面
我在这里对3个类别分别又建立了3个文件夹

这里写图片描述
这是其中的一个类别,其他

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值