论文笔记:Rich feature hierarchies for accurate object detection and semantic segmentation(R-CNN)

本文介绍了RCNN检测网络,一种经典的两阶段目标检测方法。首先使用卷积神经网络生成区域提案,然后提取特征向量并利用SVM进行分类。最后通过非极大值抑制去除重复的边界框。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文笔记:RCNN

这是CVPR 2014的一篇经典论文,首次提出R-CNN检测网络,虽然速度很慢,但是在那个时间点已经算是一个开创性的工作了。

简介

这篇文章提出了一个二阶段的方法进行目标检测。第一步通过一个卷积神经网络生成2000个区域提案。第二步通过神经网络提取特征向量;第三步通过SVM将特征向量分类。最后通过非极大值抑制NMS删除IOU大于0阈值的框。
在这里插入图片描述

具体实现

区域提案

通过快速模式的选择性搜索获得2000个提案、

特征提取

对于获得的提案,在将区域尺寸变换到227*227(神经网络输入尺寸)之前,先将提案的区域扩充以增加环境信息,并确保尺寸变换之后,环境信息有p像素宽(p=16)。
神经网络对每一个区域提取出一个4096维度的特征向量。

分类

使用一个权重系数矩阵为 4096 × N 4096 \times N 4096×N尺寸的SVM将特征向量分成N类。

训练

CNN用ILSVRC 2012数据进行预训练,使用VOC进行fine-tune。训练分类器时,考虑到样本过多,采用难例挖掘(hard negative mining method)选择样本训练SVM。

性能

一张图片13s(GPU),mAP比之前最好的算法提高了30%

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值