原文地址:https://arxiv.org/pdf/1811.11431.pdf
一、主要工作
1.提出ESPNetV2,用分组卷积和深度可分离膨胀卷积学习大感受视野的表征,并且降低FLOPs和参数量。
2.在上一个版本中的ESPNet中提出HHF模块,用特征图逐渐相加的方式来避免膨胀卷积带来的
采样稀疏问题(网格效应)。
3.将特征压缩后按通道分组进行不同膨胀率的卷积,减少了参数量,扩大了空间感受率。
4.每一个基本的block都在输出中添加输入特征的池化信息,这样可以同时保留输入信息和卷积后的信息。
二、创新点
1.在ESPNetV2基本组成block结构中使用特征累加避免网格效应。
2.用分组卷积合并的方式减少计算量。

在上图中K*d=N,也即是说K个卷积之后的特征图合并之后刚好通道数等于N,这样整个模块就可以看做是d*d*M*N的卷积的作用,但是该模块比d*d*M*N的卷积计算参数量要小很多,而且感受视野也比后者大。模块中采用不同膨胀率的卷积之后的特征进行累加之后再进行通道合并,这样可以有效避免膨胀卷积稀疏采样的问题。网络中的激活函数使用了prelu,而不是relu。