从2012年之后,alexnet网络的横空出世,带来了深度学习的春天,深度学习在图像,语音等领域大放异彩,几乎碾压其它传统机器学习算法,之后的vgg网络更是被用于计算机视觉的各个任务中,比如本人研究的reid方向,很多方法都是基于vgg网络来设计算法,下面就简单介绍一下这两个网络的优秀之处。
1,alexnet
lenet是最早用于数字识别的cnn网络,alexnet也主要是对于此网络的改进,下面直接看pytorch对于这2个网络的代码实现:
1.1 lenet
class LeNet5(nn.Module):
def __init__(self):
super().__init__()
#定义卷积层,1个输入通道,6个输出通道,5*5的卷积filter,外层补上了两圈0,因为输入的是32*32
self.conv1 = nn.Conv2d(1, 6, 5, padding=2)
#第二个卷积层,6个输入,16个输出,5*5的卷积filter
self.conv2 = nn.Conv2d(6, 16, 5)
#最后是三个全连接层
self.fc1 = nn.Linear(16*5*5, 120)
self.fc2 = nn.Linear(120, 84)