caffe学习笔记

本文介绍了Caffe学习中遇到的问题与解决方法,包括accuracy为0的解决、学习速率调整、卷积层与全连接层的作用、finetuning的步骤和注意事项,以及训练过程中的参数设置和数据准备。此外,还提到了测试阶段的设置和恢复训练的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

accuracy为0:最后一层的输出不等于样本类别数。

synset_words.txt 从0开始一个类名对应一个数字,如
car 0
cat 1
dog 2

学习速率可以减小,否则下降太快,加大学习率会加快拟合速度,但是如果调得太大会导致切线旋转过度而无法收敛。

Convolution 层使用一系列可训练的卷积核对输入图像进行卷积操作,每组卷积核生成输出图像中的一个特征图。

InnerProduct 层(也被称作全连接层)将输入看成一个一向量,输出也为向量(输出 blob的高和宽都为 1)

fine-tuning

finetune的过程相当于继续训练,跟直接训练的区别是初始化的时候:
a. 直接训练是按照网络定义指定的方式初始化(如高斯随机初始化)
b. finetune是用你已经有的参数文件来初始化(就是之前训练好的caffemodel)

fine_tuning的过程其实就是用训练好的参数(可以从已训练好的模型中获得)初始化自己的网络,然后用自己的数据接着训练,参数的调整方法与 from scratch训练过程一样(梯度下降)。对于初始化过程,我们可以称自己的网络为目标网络,训练好的模型对应网络为源网络,要求目标网络待初始化的层要 与源网络的层相同(层的名字、类型以及层的设置参数等等均相同)。

finetune 的好处就是可以直接获得我们难以或者无法训练的底层参数.

output要与样本类别一致

如果使用cpu模式,那么最后的-gpu省略。
●Train as normal

layer{

layer {

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值