训练较深的卷积神经网络时遇到的问题

最近训练一个12层的cnn网络

参考了vgg和googlenets的思想,自己做了些微调

在有噪声的手写体识别上达到了98.59%的准确率

 

在训练时,前1000次,loss和acc就好像没有收敛一样

因为,神经网络太深,参数太多

我们要用更多时间去使网络提取到对应的参数

所以,一次训练到3k次以上之后再看效果

 

在训练的后期

train_acc = 0.997

varify_acc = 0.975的时候

我以为验证集准确率不会要有多大提升了

但是,再又训练了2k次之后

准确率提升了1%

 

超参数的选择:

前期训练是keep_prob=0.9, L2参数为0.01

为的是能让网络尽快收敛

 

后期的keep_prob 和L2参数自己根据网络过拟合情况自己调整

 

转载于:https://www.cnblogs.com/shensobaolibin/p/9173290.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值