引言
这是RBG的第2篇目标检测论文,主要内容是对R-CNN和SPP-Net进行改进。
R-CNN和SPP-Net的问题
- 前者的feature map计算冗余,没有共享,在SPP-net中被解决;
-后者的 Pipeline之间是独立的,因此feature都被写入了磁盘
Fast R-CNN的贡献
- mAP值更高(废话,不高你发出来)
- 引入了multi-task loss,后文会有公式,是将分类和回归放在一个网络中做。
- feature 不需要写入磁盘(这个我不是很懂)
Fast R-CNN流程
- 输入一张图片和一组ROI;
- 图片提取CNN feature map;
- 利用ROI网络提取每一个Proposal的特征向量
- 特征向量分到两个子网络当中进行计算:第1个子网络计算每一个ROI分类的概率,第2个子网络回归每一个检测框的4个坐标(t1,t2,t3,t4)
ROI池化网络
ROI网络使用固定的空间尺寸H*W(7*7)