R-CNN——AlexNet模型学习

葱葱冲鸭

于 2020-02-14 10:15:32 发布

阅读量2.3k

点赞数

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/M_harbor/article/details/104258977

目录

一、模型结构

1.1 Conv1阶段DFD

1.2 Conv2阶段DFD

1.3 Conv3阶段DFD

1.4 Conv4阶段DFD

1.5 Conv5阶段DFD

1.6 Fc6阶段DFD

1.7 Fc7阶段DFD

1.8 Fc8阶段DFD

二、模型理解

2.1 为什么使用卷积神经网络

2.2 为什么使用Relu激活函数

2.3 为什么要归一化

2.3 为什么要重叠池化

2.4 为什么要数据扩展

2.5 为什么要Dropout

一、模型结构

1.1 Conv1阶段DFD

输入图像：227*227*3

Conv1：卷积核大小11*11*3，卷积核数量96，卷积步长4，不填充

经过卷积：55*55*96【(227-11)/4+1=55】

Relu1：激活层 55*55*96

Pool1：池化层 27*27*96

Norm1：归一化

输出： 27*27*96

Tips：

第一卷积层运算结束后形成的像素层的规模为27*27*96。分别对应96个卷积核所运算形成。这96层像素层分为2组，每组48个像素层，每组在一个独立的GPU上进行运算。

反向传播时，每个卷积核对应一个偏差值。即第一层的96个卷积核对应上层输入的96个偏差值

1.2 Conv2阶段DFD

输入图像：27*27*96

Conv2：27*27*96的像素数据分成27*27*48的两组像素数据，卷积核大小5*5*48，数量为256，分为两组，填充2

经过卷积：两组27*27*128个卷积后的像素层【(27-5+2*2)/1+1=27】

Relu2：激活层两组27*27*128的像素层

Pool2：池化层两组13*13*128的像素层

Norm2：归一化运算的尺度为5*5

输出：第二卷积层运算结束后形成的像素层的规模为2组13*13*128的像素层

1.3 Conv3阶段DFD

1.4 Conv4阶段DFD

1.5 Conv5阶段DFD

输入数据：2组13*13*192的像素层

Conv5：每个GPU中共13*13*128个卷积核，两个GPU中共13*13*256个卷积后的像素层

经过卷积：两组13*13*128的像素层【(13-3+1*2)/1+1=13】

Relu5：激活层，两组13*13*128像素层，共13*13*256个像素层。
Pool：两组6*6*128的像素层数据

1.6 Fc6阶段DFD

输入数据：6*6*256

滤波器：6*6*256尺寸，数量4096

经过卷积：4096个运算结果

Relu6：4096

Drop：4096

Tips：

由于第六层的运算过程中，采用的滤波器的尺寸与输入数据（待处理的feature map）的尺寸相同，即滤波器中的每个系数只与feature map中的一个像素值相乘，而其它卷积层中，每个滤波器的系数都会与多个feature map中像素值相乘

因此，将第六层称为全连接层

第五层输出的6*6*256规模的像素层数据与第六层的4096个神经元进行全连接，然后经由relu6进行处理后生成4096个数据，再经过dropout6处理后输出4096个数据。

1.7 Fc7阶段DFD

第六层输出的4096个数据与第七层的4096个神经元进行全连接，然后经由relu7进行处理后生成4096个数据，再经过dropout7处理后输出4096个数据。

1.8 Fc8阶段DFD

第七层输出的4096个数据与第八层的1000个神经元进行全连接，经过训练后输出被训练的数值。

二、模型理解

2.1 为什么使用卷积神经网络

2.1.1 什么是神经元

神经网络由大量的神经元相互连接而成。每个神经元接受线性组合的输入后，最开始只是简单的线性加权，后来给每个神经元加上了非线性的激活函数，从而进行非线性变换后输出。每两个神经元之间的连接代表加权值，称之为权重（weight）。不同的权重和激活函数，则会导致神经网络不同的输出。

神经网络的每个神经元如下，可以看做是一个对数据处理的过程——对数据进行线性加权、非线性激活的过程。

2.1.2 什么是神经网络

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄7年

4
原创

1
点赞

9
收藏

2
粉丝

关注

私信

热门文章

分类专栏

JAVA

上一篇：: 求最大公约数

最新评论

井字棋UCT
CQY_magician: 这里要输入的u和v是啥意思
井字棋UCT
编程小萌新: 哇啊哇哇，厉害厉害！！！！
Stake Your Claim
葱葱冲鸭回复编程小萌新: [表情]＾[表情]＾[表情]
Stake Your Claim
编程小萌新: 很好

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。