41、主流CNN架构解析与实践

主流CNN架构解析与实践

1. GoogLeNet架构

GoogLeNet在大规模图像识别任务中表现出色,其架构设计有诸多独特之处:
- 池化层加速计算 :使用最大池化层将图像的高度和宽度缩小为原来的一半,以此加快计算速度。
- Inception模块堆叠 :包含九个Inception模块的堆叠,并穿插几个最大池化层,用于降低维度和加速网络。
- 全局平均池化层 :输出每个特征图的均值,去除剩余的空间信息。由于输入图像通常为224×224像素,经过5次最大池化层处理后,特征图尺寸变为7×7。该层的降维作用使得无需在CNN顶部设置多个全连接层,从而显著减少了网络参数数量,降低过拟合风险。
- 后续层 :包括用于正则化的Dropout层、具有1000个单元的全连接层(因为有1000个类别)以及Softmax激活函数,用于输出估计的类别概率。

原始的GoogLeNet架构还在第三和第六个Inception模块顶部添加了两个辅助分类器,由一个平均池化层、一个卷积层、两个全连接层和一个Softmax激活层组成。训练时,它们的损失(缩小70%)会添加到总损失中,目的是解决梯度消失问题和正则化网络,但后来发现其效果相对较小。

Google研究人员后来提出了GoogLeNet的多个变体,如Inception - v3和Inception - v4,使用了略有不同的Inception模块,性能更优。

2. VGGNet架构

VGGNet在2014年的ILSVRC挑战

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值