From Inception to Xception

最新推荐文章于 2024-01-28 02:00:00 发布

原创最新推荐文章于 2024-01-28 02:00:00 发布 · 558 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#1x1卷积核 #Inception

深度学习专栏收录该内容

8 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

首先介绍1x1卷积核的作用，其次分别引出Inception及Xception的思想

1x1卷积核的作用

1.实现跨通道信息的整合或拆分

首先看一下2x2的卷积核

输入：4x4x3 卷积核：2x2x3x1 输出：3x3x1
2X2的卷积核将图中的12个输入节点组合映射到1个输出节点上。
3_in_1_out

接着看1x1的卷积核

输入：4x4x3 卷积核：1x1x3x2 输出：4x4x2
1x1的卷积核将下面左图中的3个输入节点组合映射到2个输出节点上。
这里写图片描述

输入：4x4x3 卷积核：1x1x3x4 输出：4x4x4
1x1的卷积核将上面右图中的3个输入节点组合映射到4个输出节点上。

因此，1*1的卷积就是对每个像素点，将多个channels的feature maps线性组合（实现跨通道信息的整合或拆分），当输出channels小于输入channels，即实现了降维（信息整合）。反之则是升维（信息拆分）。

2.大大减少参数数量

上图为Inception模型中，采用1x1卷积核前后的网络结构。
假设输入的feature map是28×28×192，1×1卷积通道为64，3×3卷积通道为128,5×5卷积通道为32。
对左图，卷积核参数个数为：
1×1×192×64+3×3×192×128+5×5×192×32
而右图对3×3和5×5卷积层前分别加入了通道数为96和16的1×1卷积层，这样卷积核参数个数就变成了：
1×1×192×64+（1×1×192×96+3×3×96×128）+（1×1×192×16+5×5×16×32）
参数大约减少到原来的三分之一。
同时在并行pooling层后面加入1×1卷积层后也可以降低输出的feature map数量，左图pooling后feature map是不变的（192），再加卷积层得到的feature map（64+128+32），会使输出的feature map扩大到192+64+128+32=416，如果每个模块都这样，网络的输出会越来越大。而右图在pooling后面加了通道为32的1×1卷积，使得输出的feature map数降到了64+128+32+32=256。