Receptive Field Block Net for Accurate and Fast Object Detection 用于快速精确的目标检测的接受野模块
Code link: https://github.com/ruinmessi/RFBNet
摘要:目前表现最好的目标检测依赖于深度主干网络的,比如说ResNet-101 和inception,得益于强大的特征表征能力但具有较高的计算消耗,相反一些轻量级的模型检测器能够实时监测,然后准确率方面存在不足,本文我们研究建立高效和准确的检测器通过手工特征机制增强轻量级模型特征,受到人类接受野的限制,提出了新的接受野模块,为了提高其区别特征和鲁棒性,构建了RFB网络框架,为了验证高效性,实验证明了两个版本展示了其在达到高精度的同时实现实时性的保持。
引言
近年来,rcnn更新迭代,fast rcnn、faster rcnn在物体检测方面表现出卓越的性能,其遵循两阶段的的流程,第一阶段先进行物体提议,第二阶段进行分类。Cnn具有期望学习到高区别特征的物体特征编码能力并对适度的位置变化鲁棒性,多数是不准确的Bbox引起,最近的研究证明了这一点,比如说 ResNet Inception 从较深层的主干网络中提取特征,【19】构建从上到下的模型,构建特征金字塔,整合高低水平的信息,mask-rcnn 利用区域对齐层生成更加精确的区域特征,这些方法采用提高特征来取得较好的结果,然而来自深层网络附带较高计算资源 ,导致较低的速度
为了加速检测,单阶段的框架产生,物体区域提议阶段被舍弃,单阶段的YOLO和SSD展示了实时处理的能力,但是精度降低了百分之十到四十,最近的DSSD and RetinaNet提高了精度的分数,不幸的是他们的优秀表现依旧依赖于深度网络,RESNET-101其限制了效率
通过以上讨论,建立强大的检测器合理的是提高轻量级模型的特征表征能力,并不是单纯增加的模型深度而是一定程度上手工特征机制。另一方面 神经科学发现人类视觉皮质,人类接受野的尺寸是一个偏心函数