caffe训练（2）生成train.txt、val.txt及test.txt文件的分类命令流-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_42535423/article/details/103667381

本文介绍了一种用于Caffe图像分类训练的txt文件生成方法，通过shell脚本自动化处理，从指定的数据源路径查找并组织图片路径及类别标签，最终形成训练和验证所需的txt文件。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在进行caffe训练前需要生成train.txt文件，caffe图像分类训练流程见博客，本文提供了另外一种生成txt文件的命令流。

#!/usr/bin/env sh
DATA=examples/myfile4/data    #数据来源的路径 
MY=examples/myfile4/data      #生成的txt文件存储位置
 
echo "Create train.txt..."
rm -rf $MY/train.txt          #先把文件中原有的同名文件删除
	
find $DATA/train -name 00000*.jpg | cut -d '/' -f4-5 | sed "s/$/ 0/">>$MY/train.txt    
find $DATA/train -name 00001*.jpg | cut -d '/' -f4-5 | sed "s/$/ 1/">>$MY/train.txt
find $DATA/train -name 00002*.jpg | cut -d '/' -f4-5 | sed "s/$/ 2/">>$MY/train.txt
find $DATA/train -name 00003*.jpg | cut -d '/' -f4-5 | sed "s/$/ 3/">>$MY/train.txt
find $DATA/train -name 00004*.jpg | cut -d '/' -f4-5 | sed "s/$/ 4/">>$MY/train.txt
find $DATA/train -name 00005*.jpg | cut -d '/' -f4-5 | sed "s/$/ 5/">>$MY/train.txt
 
echo "Create val.txt..."
rm -rf $MY/val.txt
 
find $DATA/val -name 00000*.jpg | cut -d '/' -f4-5 | sed "s/$/ 0/">>$MY/val.txt
find $DATA/val -name 00001*.jpg | cut -d '/' -f4-5 | sed "s/$/ 1/">>$MY/val.txt
find $DATA/val -name 00002*.jpg | cut -d '/' -f4-5 | sed "s/$/ 2/">>$MY/val.txt
find $DATA/val -name 00003*.jpg | cut -d '/' -f4-5 | sed "s/$/ 3/">>$MY/val.txt
find $DATA/val -name 00004*.jpg | cut -d '/' -f4-5 | sed "s/$/ 4/">>$MY/val.txt
find $DATA/val -name 00005*.jpg | cut -d '/' -f4-5 | sed "s/$/ 5/">>$MY/val.txt
 
echo "All done"

find：$DATA/val表示数据来源的路径文件夹
name：其中15001、15059等表示图片名称前缀，初始命名时表示某类
cut -d ‘/’ -f4-5：表示先按符号“/”分段，分段后结果中，-f 表示取第几个字段
例子：
其中例如一个图片的绝对路径为‘/home/ww/xc/newbuild/train/00001_0.696860780225.jpg’
-f1 在.txt文件中显示 0
-f3-4 在.txt中显示 ww/xc 0
-f6-7 在.txt中显示 train/00001_0.683245042607.jpg 0
因此-f后面数字如何确定基本应该清楚了，第一个符号“/”前定位符为1。