目录
前言
之前有一段时间看了挺多深度学习方面的论文,但是由于时间方面的问题一直没来得及进行总结。最近一段时间突发奇想把自己看论文时的学习笔记给记录一下,由于之前没写过博文,所以排版可能会有点emmm...一言难尽。专业方面的知识,如果有理解不到位的地方欢迎各位大佬指教。
Abstract
本文的主要工作:
- 提出了一个可在移动端应用的高效网络MobileNets,其使用深度可分类卷积使网络轻量化同时保证精度。
- 引入两个全局超参数,让使用者可根据约束条件调整网络大小。
- 在ImageNet分类集上与其他模型进行了广泛对比,验证了MobileNets的有效性。
1、Introduction
文章这一部分主要是简要介绍了一下,深度网络的发展和应用,并且引出自己提出的MobileNets网络,指出其在移动端应用方面的有效性。
2、Prior Work
文章的这一部分主要是介绍了对网络进行收缩和小型化的方法,以及相关的网络及研究成果。
1、相关网络:
- Inception网络:使用深度可分离卷积减少前几层的计算量。
- Flattened网络:网络由完全分解的卷积构建。
- Xception网络:演示了如何按比例扩展深度可分离卷积核。
- Squeezenet网络:使用瓶颈方法设计了一个非常小的网络。
2、获得小型网络的方法:
- 对预训练网络进行压缩:基于乘积量化、散列以及修剪、矢量量化和霍夫曼编码的压缩。
- 蒸馏:使用较大的网络教授较小的网络。
3、MobileNet Architecture
3.1、深度可分离卷积
文章这一部分主要是介绍普通卷积和深度可分离卷积在计算方式上的差异,并且给出他们在所需计算量上的不同。假设为输入特征图,
为卷积核的尺寸,
为输出特征图
的尺寸,
是输入通道数,
是输出通道数。
1、标准卷积
- 假设步长为1,并且有填充,则标准卷积计算特征图的表达式如下所示:
- 很明显,进行一次标准卷积的计算量如下:
- 卷积一般有两个作用:1.使用卷积核(过滤器)对图中的特征进行提取。2.对提取的特征进行融合。在标准卷积中这两步一般是同时进行的,但是在深度可分离卷积中这两步是分开的。

2、深度可分离卷积
- 深度可分离卷积由两次卷积构成:深度分离卷积和逐点卷积。
- 深度分离卷积:深度分离卷积把输入特征图的所有通道进行分离,每个通道对应一个卷积核对该通道的特征图进行单独的卷积操作(也就是说在深度分离卷积中,每个卷积核的深度固定为1)。因此深度分离卷积计算特征图的表达式和计算量如下: