算法流程
Fast R-CNN是作者Ross Girshick继R-CNN后的又一力作。同样使用VGG16作为网络的backbone,与R-CNN相比训练时间快9倍,测试推理时间快213倍,准确率从62%提升至66%(再Pascal VOC数据集上)。
对比
这样就避免原始图像中的同一部分在不同候选框中反复提取特征
Fast R-CNN是先对整张图片提取特征,然后对提取出的特征图生成候选框,再去crop
映射的对象变了,RCNN是图像,FastRCNN是直接映射特征图
训练数据的采样
但是如果你的样本是均衡分布的,比如100个题ACBD各占25%,你全部乱选你期望得分应该是25,这样的话你只能通过去学习如何真正有用的知识去判断每个题目选什么。
Rol Pooling Layer
在RCNN当中,使用的卷积神经网络要求图像的输入是227×227。在Faster-RCNN就不对图像尺寸做出限制。
分类器