caffe训练(2)生成train.txt、val.txt及test.txt文件的分类命令流

本文介绍了一种用于Caffe图像分类训练的txt文件生成方法,通过shell脚本自动化处理,从指定的数据源路径查找并组织图片路径及类别标签,最终形成训练和验证所需的txt文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在进行caffe训练前需要生成train.txt文件,caffe图像分类训练流程见博客,本文提供了另外一种生成txt文件的命令流。

#!/usr/bin/env sh
DATA=examples/myfile4/data    #数据来源的路径 
MY=examples/myfile4/data      #生成的txt文件存储位置
 
echo "Create train.txt..."
rm -rf $MY/train.txt          #先把文件中原有的同名文件删除
	
find $DATA/train -name 00000*.jpg | cut -d '/' -f4-5 | sed "s/$/ 0/">>$MY/train.txt    
find $DATA/train -name 00001*.jpg | cut -d '/' -f4-5 | sed "s/$/ 1/">>$MY/train.txt
find $DATA/train -name 00002*.jpg | cut -d '/' -f4-5 | sed "s/$/ 2/">>$MY/train.txt
find $DATA/train -name 00003*.jpg | cut -d '/' -f4-5 | sed "s/$/ 3/">>$MY/train.txt
find $DATA/train -name 00004*.jpg | cut -d '/' -f4-5 | sed "s/$/ 4/">>$MY/train.txt
find $DATA/train -name 00005*.jpg | cut -d '/' -f4-5 | sed "s/$/ 5/">>$MY/train.txt
 
echo "Create val.txt..."
rm -rf $MY/val.txt
 
find $DATA/val -name 00000*.jpg | cut -d '/' -f4-5 | sed "s/$/ 0/">>$MY/val.txt
find $DATA/val -name 00001*.jpg | cut -d '/' -f4-5 | sed "s/$/ 1/">>$MY/val.txt
find $DATA/val -name 00002*.jpg | cut -d '/' -f4-5 | sed "s/$/ 2/">>$MY/val.txt
find $DATA/val -name 00003*.jpg | cut -d '/' -f4-5 | sed "s/$/ 3/">>$MY/val.txt
find $DATA/val -name 00004*.jpg | cut -d '/' -f4-5 | sed "s/$/ 4/">>$MY/val.txt
find $DATA/val -name 00005*.jpg | cut -d '/' -f4-5 | sed "s/$/ 5/">>$MY/val.txt
 
echo "All done"
  • find:$DATA/val表示数据来源的路径文件夹
  • name:其中15001、15059等表示图片名称前缀,初始命名时表示某类
  • cut -d ‘/’ -f4-5:表示先按符号“/”分段,分段后结果中,-f 表示取第几个字段
  • 例子:
    其中例如一个图片的绝对路径为‘/home/ww/xc/newbuild/train/00001_0.696860780225.jpg’
    -f1 在.txt文件中显示 0
    -f3-4 在.txt中显示 ww/xc 0
    -f6-7 在.txt中显示 train/00001_0.683245042607.jpg 0
    因此-f后面数字如何确定基本应该清楚了,第一个符号“/”前定位符为1。
### Caffe中deploy.prototxttrain_val.prototxt的区别及用途 在Caffe框架中,`deploy.prototxt`和`train_val.prototxt`是两种不同的网络配置文件,它们分别用于不同的场景。以下是两者的详细区别及用途: #### 1. **train_val.prototxt** - `train_val.prototxt`主要用于定义模型的训练和验证阶段的网络结构。 - 它包含了完整的网络层定义,包括输入数据层(如`Data`层)、损失函数层(如`SoftmaxWithLoss`层)以及准确性评估层(如`Accuracy`层)。这些层在训练和验证过程中是必需的[^2]。 - 此外,`train_val.prototxt`还可能包含一些与训练相关的参数,例如学习率调整、正则化等设置。 - 文件中通常会有多个`phase`属性,用于区分训练阶段(`TRAIN`)和验证阶段(`TEST`)的网络配置。 示例代码: ```protobuf layer { name: "data" type: "Data" top: "data" top: "label" include { phase: TRAIN } transform_param { mirror: true crop_size: 227 mean_file: "data/ilsvrc12/mean.binaryproto" } data_param { source: "examples/imagenet/train_lmdb" batch_size: 256 backend: LMDB } } ``` #### 2. **deploy.prototxt** - `deploy.prototxt`主要用于模型部署阶段,即在测试或实际应用中使用训练好的模型进行预测时的网络结构定义。 - 它通常是从`train_val.prototxt`简化而来的,去掉了与训练相关的内容,例如数据输入层、损失函数层和准确性评估层[^3]。 - 在`deploy.prototxt`中,输入数据层被替换为`Input`层,用户需要手动指定输入数据的形状。 - 此外,`deploy.prototxt`中不包含任何与训练过程相关的参数,例如学习率、动量等。 示例代码: ```protobuf layer { name: "data" type: "Input" top: "data" input_param { shape: { dim: 1 dim: 3 dim: 227 dim: 227 } } } ``` #### 3. **主要区别** | 特性 | train_val.prototxt | deploy.prototxt | |--------------------|-----------------------------------------------------|--------------------------------------------------| | **用途** | 训练和验证阶段 | 测试和部署阶段 | | **输入层类型** | Data层或其他数据输入层 | Input层 | | **是否包含损失层** | 包含(如SoftmaxWithLoss) | 不包含 | | **是否包含评估层** | 包含(如Accuracy) | 不包含 | | **是否包含训练参数** | 包含(如学习率、动量等) | 不包含 | #### 4. **生成关系** - `deploy.prototxt`通常可以通过从`train_val.prototxt`中删除与训练无关的部分生成[^2]。 - 具体操作包括:移除`Data`层,添加`Input`层,删除损失函数层和评估层等。 --- ### 示例对比 #### train_val.prototxt片段 ```protobuf layer { name: "loss" type: "SoftmaxWithLoss" bottom: "fc8" bottom: "label" top: "loss" } layer { name: "accuracy" type: "Accuracy" bottom: "fc8" bottom: "label" top: "accuracy" include { phase: TEST } } ``` #### deploy.prototxt片段 ```protobuf layer { name: "fc8" type: "InnerProduct" bottom: "fc7" top: "fc8" param { lr_mult: 1 decay_mult: 1 } param { lr_mult: 2 decay_mult: 0 } inner_product_param { num_output: 1000 weight_filler { type: "xavier" } bias_filler { type: "constant" value: 0 } } } ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值