Slimmable Neural Networks
论文地址:https://arxiv.org/abs/1812.08928
Github: https://github.com/JiahuiYu/slimmable_networks
OpenReviews:https://openreview.net/forum?id=H1gMCsAqY7
Motivation
移动端的应用对算法运行效率有较高要求,但不同的移动端设备计算能力差异很大,即使是同一设备计算资源也会变化(例如运行很多后台程序,省电模式等情况)。现有的轻量级网络结构,例如MobileNet、ShuffleNet等,通过width multiplier来控制模型复杂度,训练得到多种宽度的模型,并针对不同设备进行部署。但是作者认为此种方式欠缺灵活性,不能在运行时对模型进行调整,所以提出了一种新的网络训练方式。
该方法能够训练一个网络模型,并在运行时根据精度和速度要求来动态调整网络宽度,可以理解为不同规模的模型共享一组参数。此种方式训练得到的模型,称为Slimmable Neural Network,在不同宽度设置的情况下能够与单独训练的模型具有差不多的分类精度,且在物体检测、实例分割、人体关键点检测等任务上具有更高的性能。


Slimmable Neural Networks是一种新型的深度学习模型,旨在解决移动端应用对算法效率的需求。该模型能根据运行时的精度和速度要求动态调整网络宽度,实现不同规模模型的共享参数。通过引入Switchable Batch Normalization解决训练和测试时的统计不一致问题,提升物体检测、实例分割等任务的性能。研究还表明,联合训练多个子网络可以改善模型的整体准确率,甚至对全宽度模型也有所提升。
最低0.47元/天 解锁文章
381





