深度学习-解读GoogleNet深度学习网络
深度学习中,经典网络引领一波又一波的技术革命,从LetNet到当前最火的GPT所用的Transformer,它们把AI技术不断推向高潮。2012年AlexNet大放异彩,它把深度学习技术引领第一个高峰,打开人们的视野。
用pytorch构建CNN经典网络模型GoogleNet,又称为Inception V1 ,还可以用数据进行训练模型,得到一个优化的模型。
深度学习
深度学习-回顾经典AlexNet网络:山高我为峰-优快云博客
GPT实战系列-如何用自己数据微调ChatGLM2模型训练_pytorch 训练chatglm2 模型-优快云博客
Caffe笔记:python图像识别与分类_python 怎么识别 caffe-优快云博客
深度学习-Pytorch同时使用Numpy和Tensors各自特效-优快云博客
深度学习-Pytorch运算的基本数据类型_pytorch支持的训练数据类型-优快云博客
Python Faster R-CNN 安装配置记录_attributeerror: has no attribute 'smooth_l1_loss-优快云博客
GoogleNet概述
GoogLeNet是2014年Christian Szegedy提出的一种全新的深度学习结构,和VGGNet同一年诞生,获得2014年ILSVRC竞赛的第一名。
在这之前的AlexNet、VGG等结构都是通过增大网络的深度(层数)来获得更好的训练效果,但层数的增加会带来很多负作用,比如overfit、梯度消失、梯度爆炸等。
inception的提出则从另一种角度来提升训练结果:能更高效的利用计算资源,在相同的计算量下能提取到更多的特征,从而提升训练结果。
网络结构
Inception结构
inception结构的主要贡献有两个:
一是使用1x1的卷积来进行升降维;
二是在多个尺寸上同时进行卷积再聚合。
GoogleNet 的结构主要有Inception模块构成,主要有9个Incepion模块,和两个卷积模块构成。Inception也有2个改版。
结构描述
输入图像3通道分辨率:224x224x3
9层:图像输入后,5个卷积层,3个全连接层,1个输出层;
(1)C1:64个conv 7x7,stride=2–> MaxPool 3x3, stride=2 --> 输出 64个56x56;
(2)C2:192个conv 3x3, stride=2 --> MaxPool 3x3, stride=2 --> 输出 192个28x28;
(3)inception(3a) :–> 输出 256个28x28;
(4)inception(3b) :–> 输出 480个28x28;–> MaxPool 3x3, stride=2 --> 输出 480个14x14;
(5)inception(4a) :–> 输出 512个14x14;
(6)inception(4b) :–> 输出 512个14x14;
(7)inception(4c) :–> 输出 512个14x14;
(8)inception(4d) :–> 输出 528个14x14;
(9)inception(4e) :–> 输出 832个14x14;–> MaxPool 3x3, stride=2 --> 输出 832个7x7;
(10)inception(5a) :–> 输出 832个7x7;
(11)inception(5b) :–> 输出 1024个7x7;–> AvgPool 7x1, stride=1 --> 输出 1024个1x1;
(12)Dropout(40%):–> 输出 1024个1x1;
(13)linear --> 输出 1000个1x1;
(14)softmax --> 输出 1000个1x1;
整个GoogleNet 网络包含的参数数量表。
Pytorch实现
以下便是使用Pytorch实现的经典网络结构GoogleNet
class ConvReLU(nn.Module):
def __init__(self, in_channels, out_channels, kernel_size, stride, padding):
super().__init__()
self.conv = nn.Sequential(
nn.Conv2d(in_channels=in_channels, out_channels=out_channels, kernel_size=kernel_size, stride=stride, padding=padding, bias=True),
nn.ReLU(inplace=True),
)
def forward(self, x):
return self.conv(x)
class InceptionModule(nn.Module):
def __init__(self, in_channels, c1x1_out, c3x3_in, c3x3_out, c5x5_in, c5x5_out, pool_proj):
super().__init__()
self.branch1 = ConvReLU(in_channels=in_channels, out_channels=c1x1_out, kernel_size=1, stride=1, padding=0)
self.branch2 = nn.Sequential(
ConvReLU(in_channels=in_channels, out_channels=c3x3_in, kernel_size=1, stride=1, padding=0),
ConvReLU(in_channels=c3x3_in, out_channels=c3x3_out, kernel_size=3, stride=1, padding=1)
)
self.bra