Caffe训练过程遇到的问题

针对AlexNet模型训练中损失函数值停滞不前的问题,本文详细介绍了通过调整权重和偏置初始化参数来有效解决这一难题的方法。通过对conv1层采用xavier填充方式初始化权重,以及使用常数0初始化偏置,成功地改善了模型训练效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.对AlexNet,做了修改,训练模型,但损失函数值一直在6.9左右,解决方法:

对权重及偏置进行初始化,例如

layer {
  name: "conv1"
  type: "Convolution"
  bottom: "data"
  top: "conv1"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  convolution_param {
    num_output: 32
    kernel_size: 3
    pad:1
    stride: 1
    weight_filler {
        type: "xavier"
    }
    bias_filler {
      type: "constant"
      value: 0
    }   
  }
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值