
RCNN系列
莫一丞元
根特大学PhD在读
展开
-
spp-net 理解
部分一:背景SPP-Net是何凯明2015年发表在IEEE上的论文-《Spatial Pyramid Pooling in DeepConvolutionalNetworks for Visual Recognition》,主要的创新点在于提出了空间金字塔池化。相较于R-CNN的两处缺点:R-CNN对于每个region proposal都重复的使用CNN提取特征,这是非常消耗时间的,使得特征提取成为测试时的一个时间瓶颈;对于不同size的regionproposal的feature ma原创 2020-09-04 22:36:26 · 1038 阅读 · 0 评论 -
Fast R-CNN理解
背景继2014年的RCNN之后,Ross B. Girshick(rbg)在15年推出Fast RCNN,同样使用最大规模的网络。Fast RCNN和RCNN相比,训练时间从84小时减少为9.5小时,测试时间从47秒减少为0.32秒。在PASCAL VOC 2007上的准确率相差无几,约在66%-67%之间。主要存在三个创新点:可以训练ROI Pooling层以前的参数,即全部参数。在全连接层之间加入SVD分解,网络提速。Loss由两部分构成,其一将svm替换成softmax,进行类别判原创 2020-09-04 22:24:29 · 251 阅读 · 0 评论 -
Faster R-CNN理解
背景经过R-CNN和Fast RCNN的积淀,Ross B. Girshick在2016年提出了新的Faster RCNN,在结构上,Faster RCNN已经将特征抽取(feature extraction),proposal提取,bounding box regression(rect refine),classification都整合在了一个网络中,使得综合性能有较大提高,在检测速度方面尤为明显,如下所示:主要结构Conv Layers - 输入是 image,输出是提取的图片的 fea原创 2020-09-04 22:06:25 · 366 阅读 · 0 评论 -
R-CNN理解
概述Ross Girshick在2014年的CVPR上发表论文-《Richfeature hierarchies for accurate oject detection and semantic segmentation》,首次提出R-CNN算法(可用于目标检测(要识别类别和位置)和语义分割)。可以说改变了目标检测领域的主要研究思路,紧随其后的系列文章:Fast-RCNN ,Faster-RCNN都沿袭R-CNN的思路。在RCNN之前,overfeat已经是用深度学习的方法做目标检测,但RCNN是第原创 2020-09-03 16:21:22 · 562 阅读 · 0 评论