(八)深度可分离卷积(Depthwise Separable Convolution,DSC)

本文介绍了深度可分离卷积的概念及其在Xception和MobileNet等模型中的应用。通过对比常规卷积神经网络,详细解析了Depthwise逐通道卷积与Pointwise逐点卷积的工作原理及优势。


欢迎访问个人网络日志🌹🌹知行空间🌹🌹


深度可分离卷积(Depthwise Separable Convolution,DSC)最早出现在巴黎綜合理工學院(cmap ecole polytechnique)的Laurent Sifre于2014年提交的一篇名为“Rigid-motion scattering for image classification”的博士学位论文中。但让大家对DSC熟知的则是两个著名的模型,一个是2016年10月google对Inception v3改进后提出的Xception,另一个是2017年4月谷歌提出的专注于在移动设备上的轻量级神经网络MobileNet,关于MobileNet和Xception的介绍可参考知乎博文。要理解深度可分离卷积,先来回顾一下常规卷积神经网络。

1.常规卷积神经网络

大多数的资料将常规卷积神经网络都是以单通道图像为例子,不便于理解多通道的情况。这里借用CS231N讲义上的一个例子来说明:

https://cs231n.github.io//assets/conv-demo/index.html
<iframe src="https://cs231n.github.io//assets/conv-demo/index.html" width="100%" height="700px;" style="border:none;"></iframe>(本来是一个动图,优快云这个老小子不给加载iframe标签)`

上图中,输入是5x5x3的图像,即宽W=5高H=5通道C=3,图中在输入图像上下左右边缘有+1padding,故图中宽高为7,卷积核大小3x3x2,卷积步长stride=2,根据下述公式可求卷积输出的大小:(5-3+2)/2+1=3
W o u t = W − K + 2 P S + 1 W_{out} = \frac{W-K+2P}{S} + 1 Wout=SWK+2P+1

其中W是输出图像的原始宽度,K是卷积核的大小,Ppadding的大小,stride是卷积的步长,
从上图可以得到卷积参数的计算方式为3x3x3x2=54
p a r a m e t e r s = K × K × C i n × C o u t parameters = K\times K \times C_{in} \times C_{out} parameters=K×K×Cin×Cout

图像卷积的计算可以参考下图:

在这里插入图片描述

卷积输出的通道为2卷积输入的通道为3,因此当前卷积层可理解为2个卷积核,每个卷积核的大小为3x3x3

  • 输入通道1应用卷积核W0的通道1计算

    o 0001 = 0 × 1 + 0 × 0 + 0 × ( − 1 ) + 0 × 1 + 2 × 0 + 2 × ( − 1 ) + 0 × 1 + 2 × ( − 1 ) + 1 × 1 = − 3 o0001=0\times 1+0\times 0+0\times (-1)+0\times 1+2\times 0+2\times (-1)+0\times 1+2\times (-1)+1\times 1 = -3 o0001=0×1+</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值