AlexNet

最新推荐文章于 2023-07-11 11:23:15 发布

Simple_learning_

最新推荐文章于 2023-07-11 11:23:15 发布

阅读量412

点赞数

文章标签：深度学习计算机视觉神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_51797359/article/details/126224172

版权

文章目录

1.前言
2.AlexNet架构
3.减少过拟合
- 3.1数据增强
- 3.2Dropout

1.前言

AlexNet论文
不管是图像分类、目标检测，还是语义分割、人体姿态估计，这些计算机视觉问题都是在AlexNet的基础上使用深度卷积神经网络来提取图像深层特征的
奠定了计算机视觉基本的深度学习方法和模型训练的技巧，现在仍然被借鉴

2.AlexNet架构

从LeNet开始，就奠定了神经网络基础架构：卷积层—池化层—卷积层—池化层—全连接层—输出
AlexNet相当于是将LeNet从识别数字到识别大千世界
卷积层可以认为是提取图像的特征，全连接层可以认为是用提取出来的特征进行分类（也就是说对提取出的特征进行融合和汇总）

2.1卷积层

首先AlexNet使用了深度卷积神经网络（Deep Convolutional Neural Networks）
上图是一通道（也就是灰度图）的卷积操作，想了解卷积的具体内容，可以参考一篇文章带你走进深度学习
中间的3×3的矩阵就是卷积核，对应到下图左侧的大图浅蓝色区域的就是感受野，每次感受野滑动的范围叫做步长，右侧的就是特征图
卷积核的权重是不变的，所以是局部链接，全局共享

点击查看三通道动态效果
Kernel（卷积核）是三个通道，在三维的矩阵中进行滑动
仍然是感受野中的像素，卷积核中的权重对应位置相乘，把乘积求和填在Output中，生成特征图
把所有生成的特征图结合在一起传给下一层，就是一次卷积运算

2.2池化层

在这里插入图片描述

我们在特征图（feature map)的每个窗口中取最大值或者平均值，把大的特征图，变成一个小的特征图
这个步骤就称为下采样或者池化操作
取最大值，就是最大池化(Max Pooling)
取平均值，就是平均池化(Aver Pooling)
优点：减少特征图的尺寸，减少计算量，同时可以防止过拟合

2.3全连接层

在这里插入图片描述

将所有的特征图拉成长向量，将长向量输入给全连接神经网络中
全连接神经网络就是每一个神经元都与之前的神经元相连，都有一个权重，经过全连接网络处理之后，得到最终的结果

2.4ReLU激活函数

使用了ReLU激活函数，修正了线性单元
激活函数必须是非线性的
ReLU函数当 $x$ 小于0时都是0，当 $x$ 大于0时，就是 $x$ ，不饱和的

2.5模型结构与双GPU实现

在这里插入图片描述

把模型并行的放在两个GPU上，每个GPU各自拥有一半的神经元
全连接层每个GPU各自有2048个神经元
输出层是1000个神经元，也就是将图片变成了1000维的向量，1000维就代表了这个图片是1000个中的哪一个，我们从里面挑出最大的一个或者是五个，作为预测结果就完成了分类的任务
原图的输出是224×224×3，但是由224经过一层卷积得到的特征图大小是无法计算的，所以应该是227
所有的激活函数都是使用ReLU
在第一层卷积和第二层卷积、第二层卷积和第三层卷积之间还有局部相应归一化LRN
在第二层卷积和第三层卷积使用全部连接，两个GPU之间能够全部连接
在其他层都只能接收同一个GPU从上一层传来的数据
两个GPU训练出来的卷积核结果是不一样的
第一个GPU训练得到的48个卷积核是提取边缘、频率、方向和特征
第二个GPU训练得到的48个卷积核是提取颜色特征

2.6局部响应归一化LRN

在这里插入图片描述

比如我们得到了4个特征图，我们对这4个图的同一个位置进行归一化（比如3）
选择其中三个特征图进行运算，比如橙色的特征图，3作为分子，然后4个特征图的对应位置平方作为分母：

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Simple_learning_ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。