[caffe]深度学习之CNN检测object detection方法摘要介绍

本文回顾了CNN在目标检测领域的快速发展,介绍了RCNN、SPP-NET、FAST-RCNN及FASTER-RCNN等模型。重点阐述了这些模型在检测速度与准确率方面的改进。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

[caffe]深度学习之CNN检测object detection方法摘要介绍 

  3276人阅读  评论(1)  收藏  举报

一、RCNN

流程:

Extract region(off model) + extract features(on model) + classifyregions according feature (svm or softmax)

性能:


精度:

 

二、SPP-NET

流程:

先做conv,再根据window提取特征。为什么rcnn不能也这么做呢?原因在于spp对不同尺度进行了max pool处理能更好的满足不同尺度window的特征表达。

性能:

核心思想在全图只做一次conv,这个和overfeat的思想一致

 

精度:

三、FAST-RCNN

流程:

引入了ROI层pooling,以及multi-task同时训练分类和检测框。

性能:

Compared to SPPnet, Fast R-CNN trains VGG163× faster, tests 10× faster, and is more accurate.

另外还额外提出了fc层SVD的思想


Vgg时间性能分析

 

精度:

The improvement of Fast R-CNN over SPPnetillustrates that even though Fast R-CNN uses single-scale training and testing,fine-tuning the conv layers provides a large improvement in mAP (from 63.1% to66.9%). Traditional R-CNN achieves a mAP of 66.0%. These results arepragmatically valuable given how much faster and easier Fast R-CNN is to trainand test, which we discuss next.

 

 

 

 

四、FASTER-RCNN

流程:

在fast-rcnn的基础上,借鉴了FCN的思路,将proposal阶段转化成一个layer加进了网络一起学习。


性能:

cost-free for proposal

精度:

our detection system has a frame rate of5fps (including all steps) on a GPU, while achieving state-of-the-art objectdetection accuracy on PASCAL VOC 2007 (73.2% mAP) and 2012 (70.4% mAP) using300 proposals per image


from: http://blog.youkuaiyun.com/sunbaigui/article/details/47728251
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值