深度学习总结六:VGG 网络结构 网络特性 网络训练 论文 代码 网络结构 网络特性 证明了网络的深度在一定程度上提升了模型的效果。 2个33的卷积核相当于1个55的卷积核,并且前者训练参数更少。 网络C比B多一个1*1的卷积核,即增加一个非线性函数,增加模型复杂度。 网络D在C的基础上将11卷积核修改为33卷积核,增大感受野,效果更好。 网络训练 使用带有动量的mini-batch梯度下降法,batch大小为256,动量设置为0.9。 对前两层全连接层使用dropout,dropout率设置为0.5。 初始学习率设置为 1 0 −