【论文笔记】【Faster Rcnn 优化】《Light-Head R-CNN: In Defense of Two-Stage Object Detector》

硝烟_1994

已于 2022-03-23 09:48:21 修改

阅读量3.4k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：目标检测论文文章标签：目标检测计算机视觉

于 2022-03-20 23:49:54 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_44804542/article/details/123624669

论文：https://arxiv.org/abs/1711.07264

代码： GitHub - zengarden/light_head_rcnn: Light-Head R-CNN

1.概述

我们一般将Object detection分为两大系列：

一类是two-stage detector：
- 代表算法有Faster RCNN, Mask RCNN等
- 算法分两阶段进行，第1阶段是生成proposals，第2阶段是对这些proposals进行分类、回归【精调】
另一类是one-stage detector：
- 代表算法有YOLO系列, SSD等
- 算法讲究一步到位，没有生成proposals这一过程

一般来说，two-stage系列的检测算法拥有更高的检测精度高，而singel-stage系列的算法则具备更快的检测速度。在实际工业应用【落地】中，算法的速度是我们一种重要的考虑因素，同时随着YOLO系列的算法逐步优化其精度也得到了改善，基本能够满足实际的需求，因此在实际应用中更多的可能还是one-stage系列的算法为主。

作者将论文取名为《守护二阶段物体检测器的尊严》，通过构造轻量级头部R-CNN网络，探讨了R-CNN如何在物体检测中平衡精确度和速度；

作者用Resnet-101作为base model，拿到了COCO-2017的冠军。
作者用轻量级的Xception作为base model，达到了30.7 mmAP，并且速度达到102FPS，从speed到accuracy都全面击败现有的single-stage的算法

2.为什么two-stage算法那么慢

作者认为导致two-stage慢的主要原因： Heavy Head；论文中作者对于"Head"的定义如下：

“Head” in our paper refers to the structure attached to our backbone base network. More specifically, there will be two components: R-CNN subnet and ROI warping

也就是说Head主要包含两部分：

ROI warping：通过ROI Pooling/PSRoI Pooling等方式为每一个ROI生成大小固定的特征图
RCNN subnet：基于ROI的特征图进一步实现recognition过程,

two-satge算法由于头部的计算量很大，导致即使是轻量级的back

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。