Fast R-CNN论文简单解读
引言
名称由来:Fast Region-based Convolutional Neural Network (Fast R-CNN)
秀肌肉:Fast R-CNN比R-CNN快9倍,在测试时快213倍,在PASCAL VOC 2012上实现了更高的66%的mAP,比R-CNN高4个点。与SPPnet相比,Fast R-CNN训练VGG16的速度快3倍,测试速度快10倍,并且更准确。单张图片处理仅需0.3秒(不包括生成候选框的时间)
正文
检测本质上是定位+分类。分类问题相对而言,较为简单;复杂的部分在于检测需要准确定位对象,这带来了两个主要挑战。
(1)必须处理大量候选对象位置(通常称为“proposals”)
(2)候选框仅能提供粗略的定位,必须对其进行精修以实现精确定位
这些问题的解决方案通常会影响速度、准确性或简单性。
Fast R-CNN简化了当时效果最好的基于 ConvNet 的目标检测器的训练过程,即提出了一种单阶段训练算法,该算法不仅对候选框分类,同时对候选框进行精修。
R-CNN的缺点
1、训练是多阶段的,比较繁琐。首先把ImageNet上面训练好的模型拿过来在目标检测的数据集上微调一下,其次