基于MiniGoogLeNet的图像分类:原理、实现与训练
1. Inception模块及其变体
1.1 原始Inception模块
Inception模块在网络中充当“多级特征提取器”,它在同一模块内计算1×1、3×3和5×5卷积。此外,该模块的第四个分支执行3×3最大池化,步长为1×1,这个分支通常被称为池化投影分支。
在过去,执行池化操作的模型往往能获得更高的准确率,但现在我们知道,池化层可以被卷积层替代以减小特征图的体积。在Szegedy等人的工作中,添加池化层是因为当时认为卷积神经网络需要它才能表现良好。池化层的输出会被输入到一系列1×1卷积中,以学习局部特征。
最后,Inception模块的四个分支会在通道维度上进行拼接。在实现时,会通过零填充确保每个分支的输出体积大小相同,以便进行拼接。拼接后的输出会被输入到网络的下一层。在实践中,我们通常会在进行池化操作以减小体积大小之前,堆叠多个Inception模块。
1.2 Miniception模块
原始的Inception模块是为GoogLeNet设计的,用于在ImageNet数据集上进行训练并获得最先进的准确率。对于图像空间维度较小、所需网络参数较少的小数据集,我们可以简化Inception模块,得到Miniception模块。
Miniception模块最早由@ericjang11和@pluskid在推特上展示,用于在CIFAR - 10数据集上训练。该模块的图形来自Zhang等人2017年的出版物。在MiniGoogLeNet的实现中,有三个主要模块:
- 卷积模块 :负责执行卷积
超级会员免费看
订阅专栏 解锁全文
1457

被折叠的 条评论
为什么被折叠?



