Receptive Field Block Net for Accurate and Fast Object Detection
链接:https://arxiv.org/abs/1711.07767
代码地址:https://github.com/ruinmessi/RFBNet
1、出发点
在此之前很多目标检测网络在性能上获得大幅度的提升都得益于backbone的性能提升(也就是网络越来越深的原因),但作者认为不能一味的靠增加网络深度带来性能提升,合理的替代方案是通过引入某些人工设计的机制来增强轻量级网络的特征表示,而不是顽固地加深模型。
2、理论基础
在过去的几十年中,功能性磁共振成像(fMRI)以毫米为单位的分辨率无创地测量了人类的大脑活动,而RF建模已成为一种重要的感觉科学工具,用于预测反应和阐明大脑的计算,这已经成为现实。 由于人类神经科学仪器经常观察到许多神经元的汇集反应,这些模型因此通常称为pRF(群体感受野,population Receptive Field)模型[36]。 基于fMRI和pRF建模,可以研究皮质中许多视野图之间的关系。 在每个皮质图上,研究人员发现pRF大小与偏心率之间呈正相关[36],而相关系数却有所不同在视野图中,如下图所示:

(图一)</

RFB_Net是ECCV 2018年提出的一种目标检测方法,它受到人类视觉感受野的启发,通过RFB模块增强了轻量级网络的特征表示。RFB模块结合了不同大小的卷积核和膨胀卷积,模拟了感受野与偏心率的关系,提高了特征的可分辨性和鲁棒性。实验结果显示,RFB_Net在保持模型速度的同时,提升了目标检测的准确性,尤其是在小物体检测上。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



