伪代码
feature maps=process(image)
ROIs=region_proposal(feature maps)
score_maps=compute_score_map(feature_maps)
for ROI in ROIs
V=region_roi_pool(score_maps,ROI)
class_scores,box=average(V)
class_probailities=softmax(class_scores)
基于Resnet-101,将最后的平均池化层和1000-class的全连接层去除。在ImageNet上进行预训练,resnet-101最后一层卷积层是2048维,接一个11的1024维的卷积层进行降维,然后利用一个k^2(c+1)个通道的卷积层生成分数映射。
主要贡献:
-
提出了position-sensitive score maps来解决目标检测的位置敏感性问题
- 区域为基础的,全卷积网络的二阶段目标检测框架
- 比Faster R-CNN快2.5-20倍
相同点:都是由全卷积网络和RoI-wise subnetwork组成的,输出结果维相应的类别和对应的box
不同点:与Faster R-CNN相比,R-FCN具有更深的共享卷积网络层,这样可以获得更加抽象的特征,同时它没有RoI-wise subnetwork。
分类无论目标在图像的什么位置都不影响分类,因此分类网络对位置不敏感,而检测一旦物体位置发生改变都会影响检测结果,所以检测网络对位置敏感。
F-RCN过程:
首先选择一张需要处理的图片。并对该图片进行相应的预