Fast R-CNN 论文笔记
一、为什么提出Fast R-CNN
因为Fast R-CNN的前任R-CNN和SPP-net不给力。
R-CNN训练分为多个阶段,步骤繁琐: 微调网络+训练SVM+训练边框回归器; 训练耗时又耗内存; 目标检测又慢。
SPP-net虽然比R-CNN快一些,但和R-CNN同样存在训练步骤繁锁的问题,而且无法更新SPP-net之前的卷积层。
二、Fast R-CNN的框架
Fast R-CNN的输入: 一整张图像和一系列目标候选区域(object proposal)。
1)首先用conv和max_pooling层处理整张图像,生成一张特征图(feature map)。
2)然后RoI_pooling层对感兴趣的部分区域(a region of interest)提取固定长度的特征向量。
3)特征向量通过全连接层后,分别输出到softmax层和bbox_regressor层。
注意:
1)RoI_pooling层用的方法是,把

FastR-CNN相较于R-CNN和SPP-net,简化了训练流程,提升了检测速度及精度。该模型接受整张图像和候选区域作为输入,通过卷积层、RoI池化层等处理后,分别进行类别预测和边界框回归。
最低0.47元/天 解锁文章
1812

被折叠的 条评论
为什么被折叠?



