Abstract
- 我们介绍了一种名为ShuffleNet的极其计算高效的CNN架构,该架构专为计算能力非常有限的移动设备而设计。新架构采用了两种新的操作,逐点组卷积和通道切换,大大降低了计算成本,同时保持了准确性。ImageNet分类和MS COCO物体检测的实验证明了ShuffleNet优于其他结构的优越性能,例如: 在40MFLOP的计算预算下,其在ImageNet分类任务中比MobileNet的TOP-1(绝对7.8%)的错误率还低。在基于ARM的移动设备上,ShuffleNet实现了比AlexNet大约13倍的实际加速,同时保持了相当的精度。
Introduction
- 构建越来越大的卷积神经网络(CNN)是解决主要视觉识别任务的主要趋势。最准确的CNN通常具有数百个层和数千个通道,因此需要以数十亿Flops计算。本报告研究了相反的极端:在数十或数百MFLOP的非常有限的计算预算中追求最佳精度,专注于无人机,机器人和智能手机等常见移动平台。请注意,许多现有工作集中在表示“基本”网络架构的修剪,压缩或低位。 在这里,我们的目标是探索一种高效的基本架构,专为我们所需的计算范围而设计。
- 我们注意到最先进的基本架构,如Xception和ResNeX在极小的网络中变得不那么有效,因为昂贵的密集1×1卷积。我们建议使用逐点组卷积来降低1×1卷积的计算复杂度。 为了克服群体卷积带来的副作用,我们提出了一种新颖的渠道shuffle操作来帮助跨越特征通道的信息。 基于这两种技术,我们构建了一个名为ShuffleNet的高效架构。 与流行结构相比,对于给定的计算复杂度预算,我们的ShuffleNet允许更多的特征映射通道,这有助于编码更多信息,对于非常小的网络的性能尤其重要。
- 我们根据具有挑战性的ImageNet分类和MS COCO物体检测任务评估我们的模型。 一系列对照实验表明了我们的设计原则的有效性以及比其他结构更好的性能。与最先进的架构MobileNet相比,ShuffleNet以显着的优势实