代码地址:ESPNet v2
1. 概述
这篇文章在ESPNet v1的基础上进行改进得来的,这个网络结构中使用group point-wise与depth-wise膨胀分离卷积在使用较少计算量与参数的情况下有效学习大感受野的表达。文章提出的网络结构可以扩展到其它任务中去,如目标检测、语义分割、目标分类、语言模型。相比之前的v1版本文章的网络更加快速与精确;对于检测模型YOLO v2,采用文章的方法计算量减少6倍,性能也有提升。总的说来这篇文章在v1的基础上倾向于提供一个高效的轻量级网络而不仅仅是分割模型了。
这篇文章的主要贡献:
- 1)提出了一个通用化的轻量级网络结构;
- 2)在v1版本的基础上引入了depth-wise分离膨胀卷积,使得网络感受野更大,表达能力更强;
- 3)文章中提出的网络在更少运算量下得到结果更好,无论是分类还是检测等任务上;
2. 方法设计
2.1 深度可分离膨胀卷积
在MobileNet中引入了深度可分离卷积,它可以有效降低计算量,这里在深度可分离卷积的基础上在卷积上添加膨胀系数,从而增大卷积的感受野,因而将原有 n ∗ n n*n n