深度学习总结六:VGG

本文深入探讨了VGG网络结构,包括2个33卷积核与1个55卷积核的等效性,以及网络C和D的特性。在训练过程中,采用带动量的mini-batch梯度下降法,应用dropout策略并动态调整学习率。同时,通过权重初始化和数据增强提升模型性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

深度学习总结六:VGG


论文
代码

网络结构

在这里插入图片描述

网络特性

  1. 证明了网络的深度在一定程度上提升了模型的效果。
  2. 2个33的卷积核相当于1个55的卷积核,并且前者训练参数更少。
  3. 网络C比B多一个1*1的卷积核,即增加一个非线性函数,增加模型复杂度。
  4. 网络D在C的基础上将11卷积核修改为33卷积核,增大感受野,效果更好。

网络训练

  1. 使用带有动量的mini-batch梯度下降法,batch大小为256,动量设置为0.9。
  2. 对前两层全连接层使用dropout,dropout率设置为0.5。
  3. 初始学习率设置为 1 0 −
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值