Caffe 学习系列(12):制作自己的 caffe 训练数据集

本文介绍了如何在Caffe框架下制作自己的深度学习数据集,包括准备数据、生成txt文件、转换为db文件、计算均值及训练模型的详细步骤。通过创建train.txt和val.txt文件,将数据划分为训练集和验证集,并使用shell脚本转换为lmdb数据库。接着计算图像的均值文件,以便于模型训练。最后,配置并运行solver.prototxt文件进行模型训练。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

引言

在学习和参加相关深度学习比赛的时候,一般情况下都是在准备好的情况下展开,而在实际的工作项目中。因为每一个公司的业务场景不同,需要我们自己去标记图片数据(参看深度学习标记工具汇总),并且在标记好的图片集中制作 caffe 框架的数据格式(lmdb文件),即本文所讲内容。

制作自己的 caffe 训练数据集的整个过程分为:1. 准备自己的数据集;2. 生成 .txt 文件; 3.转化为 db 文件;4. 计算均值。之后开始训练。

准备自己的数据集

这里从网上下载整理一些图片,分为两类,其中 bird 60张和 cat 60张,其中 50张 bird 和 50张 cat 作为训练集,1其余0张作为验证集。在 .../caffe/data 文件夹下新建文件夹 myself,然后在 myself 文件夹下新建两个子文件夹, train 和 val,即训练集和测试集。然后在 train 文件夹下新建两个文件夹 bird 和 cat,分别存放 50 张 bird 图片和 50 张 cat 图片,在 val 文件夹下放 10张bird 和 10张 cat 图片。至此,我们准备好了原始的数据集。

生成 train.txt 和 val.txt 文件,即训练集和验证集列表清单

在 .../caffe/examples 新建一个 myself 文件夹,用于存放配置文件和 脚本文件。

cd ~/caffe/
sudo mkdir examples/myself
# 在 caffe 根目录下进行操作,这是默认的,也是良好的习惯

sudo gedit examples/myself/create_filelist.sh

 编辑 create_filelist.sh 脚本文件,输入以下内容:

DATA=data/myself
MY=examples/myself

echo "Create train.txt..."
rm -rf $DATA/train.txt
find $DATA/train/bird -name birdt*.jpg | cut -d '/&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值