链接
SpineNet: Learning Scale-Permuted Backbone for Recognition and Localization
摘要
图像分类任务通常采用逐步减小分辨率的网络结构,但是这种结果并不适合同时需要识别和定位的任务。为减小分辨率损失问题,分类任务中采用encoder-decoder结构,但是该结构并不高效,尤其在需要产生强多尺度的特征时。我们将介绍一种通过NAS搜索得到的网络——SpineNet,它具有scale-permute intermediate 特征和cross-scale连接。相比ResNet-FPN,spineNet具有6%的AP增益。SpineNet结构也可以迁移到分类网络,在iNaturalist fine-grained dataset 比赛中,在top1 accuracy上比ResNet高出6%。
核心要点
- 尺度交换网络结构&和resNet的对比:
如何保证不同层之间的concate,connection本身包含conv或者deconv么?

- Cross-Scale connection

- upsampling用最近邻interp
- downsampling用stride=2的3x3con
SpineNet:深度学习中的尺度交换网络解析

SpineNet是一种通过NAS搜索得到的网络结构,设计用于同时解决识别和定位任务,解决了传统分辨率降低导致的信息损失问题。相比ResNet-FPN,SpineNet在目标检测任务中表现出6%的AP增益,并且在iNaturalist细粒度分类比赛中,其精度比ResNet高6%。网络特点包括scale-permute中间特征、cross-scale连接以及高效的上采样和下采样操作。实验表明,随着scale-permute结构的应用,网络性能逐步提升。
最低0.47元/天 解锁文章
2747

被折叠的 条评论
为什么被折叠?



