目标检测论文阅读笔记
目标检测论文阅读 RCNN Rich feature hierarchies for accurate object detection and semantic segmentation-优快云博客
目标检测论文阅读 SPPNet Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition-优快云博客
目标检测论文阅读 Cascade R-CNN: Delving into High Quality Object Detection-优快云博客
目标检测论文阅读 YOLO You Only Look Once:Unified, Real-Time Object Detection-优快云博客
Fast R-CNN
对于RCNN存在的问题:
训练是一个多阶段的的流程:通过日志记录的损失训练区域建议模块、调整SVM使之适合CNN特性、学习边界框回归因子
时间空间消耗大:对于SVM和边框回归,每张图像的每个区域建议的特征都要写入磁盘。对于很深的网络如VGG16,训练的时间空间消耗巨大
检测速度慢:测试时,需要从每张图像的每个区域建议提取特征
SPPnet改进:
RCNN之所以慢,是因为他对每个区域建议进行卷积计算,没有用到共享计算。SPPnet提出的空间金字塔池化网络先对整张输入图像计算卷积特征,然后再用从共享特征图(即整张图像卷积计算得到的特征)中映射得到每个区域建议的特征向量。 区域建议之间一定有很多重复部分,全都直接丢进CNN会有大量重复计算,改成从共享特征图中提取特征避免了重复计算。
但SPPnet仍有缺陷:训练仍然是多阶段的,包括提取特征、用日志损失微调网络、训练支持向量机,最后拟合边界框回归函数。特性也被写入磁盘。但与R-CNN不同,模型微调不能更新空间金字塔池化之前的卷积层,这必会影响深层网络的准确性。
Fast RCNN改进:
训练是单阶段的,使用多任务损失函数<