Faster RCNN学习笔记
一、资源介绍
Faster R-CNN是对Fast R-CNN的改进,paper可以参考点击打开链接。
Fast R-CNN和R-CNN在前两篇博客中都已经有了详细的分析。
这里简单回顾一下:
R-CNN将图像提取ROI,将所有的ROI都放入CNN中,通过SVM得到每一个ROI的分类,第二部将每一个ROI做bounding-box的回归,得到最终的检测目标分类以及位置。
Fast R-CNN在R-CNN的基础上进行了改进,把整个图片作为CNN的输入,ROI在CNN得到的conv feature map中寻找映射到的patch,同时把SVM分类换成了Softmax分类并且和bounding-box回归一起进行SGD。在速度上得到了很大的改进。
卷积神经网络运算的时间已经大大缩短了,但是产生region proposal的时间却成为了一个瓶颈。
Faster R-CNN对于region proposal的产生提出了一种新的算法,称为RPN(region proposal network),可以大大降低以前用selective search产生ROI所用的时间。在卷积层之后加入RPN,利用RPN产生的region proposal会继续输入到ROI pooling层中,之后的步骤和Fast R-CNN中的类似,产生分类以及bounding-box的回归。
Faster R-CNN详解:目标检测的加速革命

Faster R-CNN是Fast R-CNN的改进版,通过引入Region Proposal Network(RPN)显著提高了目标检测的速度。RPN在卷积层后接一个小的滑动网络,生成region proposals,减少了ROI产生的时间。训练时,正负标签基于IOU与ground truth的匹配,损失函数结合分类和bounding-box回归。Faster R-CNN将目标检测速度提升至0.05-0.2秒/张,准确率达到73.2%mAP。
最低0.47元/天 解锁文章
2036





