MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

大名鼎鼎的MobileNet,实习的时候发现工业界用的很多!今天要一探究竟了~
Depthwise Conv

本文首先对传统的卷积进行了改进(我一开始学的时候也觉得conv filter能不能换一种形式,然而两年过来了也没深入思考过了。惯性思维,相信权威……)
不再是conv filter通道数匹配feature的通道数,filter个数决定这一层feature通道数。
而是传统的conv被拆成了两步进行:

第一步,每一个filter(只有一个通道)对应输出一个feature的channel(也不用求和了),所以输出channel=M的feature,再用一个1x1conv把它变成N通道的feature
以实现和传统conv相同的目的
同样是MobileNets的架构,使用可分离卷积,精度值下降1%,而参数仅为1/7,厉害啊!

Structure
结构这张表很清晰了:

其他细节
摘要这段话挺有意思:

这两个参数在3.3 & 3.4节阐述了,不过我可能暂时用不到

本文深入解析MobileNet架构,重点介绍其创新的Depthwise Convolution(深度可分离卷积)技术,通过将传统卷积分解为两步,显著减少参数数量而不大幅牺牲精度。实验表明,使用该技术的MobileNet相较于传统卷积网络,参数量减少至1/7,精度仅下降1%。
2472

被折叠的 条评论
为什么被折叠?



