本专栏用于记录关于深度学习的笔记,不光方便自己复习与查阅,同时也希望能给您解决一些关于深度学习的相关问题,并提供一些微不足道的人工神经网络模型设计思路。
专栏地址:「深度学习一遍过」必修篇
目录
3.1 通过 torchvision.models 导入 AlexNet
1 AlexNet 模型解读
1.1 AlexNet 模型特点
- 更深的网络结构
- 使用层叠的卷积层,即卷积层
卷积层
池化层来提取图像的特征
- 使用
抑制过拟合
- 使用数据增强
抑制过拟合
- 使用
替换之前的
的作为激活函数
- 使用多
进行训练
1.2 AlexNet 模型结构
网络结构如下:

1.2.1 卷积层1
输入图像大小:
- 卷积核大小:
- 数量:
个
- 步长:
- 激活函数:
- 两台
同时训练,即共
个核
输出特征图大小:,即
池化:
,
- 输出特征图大小:
,即
标准化
1.2.2 卷积层2
输入图像大小:
- 卷积核大小:
- 数量:
个
- 步长:
- 激活函数:
- 输出特征图像先扩展
个像素,即大小
输出特征图大小:,即
池化:
,
- 输出特征图大小:
,即
标准化
1.2.3 卷积层3
输入图像大小:
- 卷积核大小:
- 数量:
个
- 步长:
- 激活函数:
- 输出特征图像先扩展
个像素,即大小
输出特征图大小:,即
1.2.4 卷积层4
输入图像大小:
- 卷积核大小:
- 数量:
个
- 步长:
- 激活函数:
- 输出特征图像先扩展
个像素,即大小
输出特征图大小:,即
1.2.5 卷积层5
输入图像大小:
- 卷积核大小:
- 数量:
个
- 步长:
- 激活函数:
- 输出特征图像先扩展
个像素,即大小
输出特征图大小:,即
池化:
,
- 输出特征图大小:
,即
1.2.6 全连接6
- 输入图像大小:
- 共
个神经元
- 输出
个向量
1.2.7 全连接7
- 输入图像大小:
- 共
个神经元
- 输出
个向量
1.2.8 全连接8
- 输入图像大小:
- 共
个神经元
- 输出
个向量
也可以看成是一种模型组合,每次生成的网络结构都不一样,通过组合多个模型的方式能够有效地减少过拟合。
2 AlexNet工程技巧
多 GPU 训练,ReLU 激活函数,LRN 归一化,Dropout 正则化,重叠池化,数据增强
- Dropout,防止过拟合,提高泛化能力
- 重叠池化(overlapping),更有利于减轻过拟合
- 裁剪翻转等数据增强策略,提高模型泛化能力
- 多 GPU 训练,尽量使用更多特征图,并减少计算量
- LRN 归一化,抑制反馈较小的神经元,放大反馈较大的神经元,增强模型泛化能力
- ReLU 激活函数,加快模型收敛
3 代码解读
3.1 通过 torchvision.models 导入 AlexNet
from torchvision.models import AlexNet
3.2 Ctrl + 鼠标左键进入 AlexNet 源码
class AlexNet(nn.Module):
def __init__(self, num_classes: int = 1000) -> None:
super(AlexNet, self).__init__()
self.features = nn.Sequential(
nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2),
nn.ReLU(inplace=True),
nn.MaxPool2d(kernel_size=3, stride=2),
nn.Conv2d(64, 192, kernel_size=5, padding=2),
nn.ReLU(inplace=True),
nn.MaxPool2d(kernel_size=3, stride=2),
nn.Conv2d(192, 384, kernel_size=3, padding=1),
nn.ReLU(inplace=True),
nn.Conv2d(384, 256, kernel_size=3, padding=1),
nn.ReLU(inplace=True),
nn.Conv2d(256, 256, kernel_size=3, padding=1),
nn.ReLU(inplace=True),
nn.MaxPool2d(kernel_size=3, stride=2),
)
self.avgpool = nn.AdaptiveAvgPool2d((6, 6))
self.classifier = nn.Sequential(
nn.Dropout(),
nn.Linear(256 * 6 * 6, 4096),
nn.ReLU(inplace=True),
nn.Dropout(),
nn.Linear(4096, 4096),
nn.ReLU(inplace=True),
nn.Linear(4096, num_classes),
)
def forward(self, x: torch.Tensor) -> torch.Tensor:
x = self.features(x)
x = self.avgpool(x)
x = torch.flatten(x, 1)
x = self.classifier(x)
return x