Caffe学习笔记—Caffe模型

本文深入探讨了深度学习系统的两大核心要素:数据与模型。详细介绍了三种关键参数——可学习参数、结构参数及训练超参数,并阐述了它们各自的作用与应用方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  一个完整的深度学习系统最核心的两个方面是数据模型
  深度学习模型通常由三部分参数组成:

  1. 可学习参数(Learnable Parameter),又称可训练参数、神经网络权系数、权重,其数值由模型初始化参数、误差反向传播过程控制,一般不可人工干预。
  2. 结构参数(Archetecture Parameter),包括卷积层、全连接层、下采样层数目、卷积核数目、卷积核大小等描述网络结构参数,一旦设定好,网络训练阶段不能更改;值得注意的是,训练阶段的参数和预测阶段的参数很可能不同。
  3. 训练超参数(Hyper-Parameter),用来控制网络训练的收敛的参数,训练阶段可以自动的或手动调节获得更好的效果,预测阶段不需该参数。

  可学习参数在内存中使用Blob对象保持,必要时以二进制ProtoBuffer文件(*.caffemodel)形态序列化并存储于磁盘之上,便于进一步微调(funetune,又称为精调)、共享、性能评估(benchmark)。
  结构参数使用ProtoBuffer文本格式(*.prototxt)描述,网络初始化通过该描述文件构建Net对象、Layer对象形成有向无环图结构,在Layer和Layer之间、Net输入源和输出均为持有数据和中间结果的Blob对象。
  训练超参数同样使用ProtoBuffer文本格式(*.prototxt)描述,训练阶段利用该描述文件构建求解器(Solver)对象,该对象按照一定的规则在训练网络时自动调节这些超参数值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值