Evolution Plan--RCNN 2014-RBG

本文介绍了一个基于ILSVRC2012数据集进行图像分类和PASCALVOC数据集进行目标检测的三步图像识别流程:区域建议生成、特征提取及线性SVM分类。采用选择性搜索获取区域建议,并利用包含五个卷积层和两个全连接层的网络提取4096维特征向量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 ILSVRC 2012--image classification

PASCAL VOC--object detection

 

 总共分为三部:1.region proposals  2.Feature extraction 3. a set of class-specific linear SVMs

1.采样时采用selective search的方法。

2. extract a 4096-dimensional feature vector from each region proposal

 网络结构:five convolutional layers and two fully connected layers 

输入:227x227的RGB图片

将小框周围的所有像素包起来,包裹之前,将小框放大使得包裹的时候有p个被包裹起来的像素是原框周围的背景信息。

在识别时,在测试图片上提取2000个区域提案,对于每一个区域:修正区域大小以适合CNN的输入,做一次前向运算,将第五个池化层的输出(就是对候选框提取到的特征)存到硬盘。将每个提案包裹起来经过CNN得到它们的特征,对于每一类,使用为这一类训练的SVM,得到每个提取的特征向量的得分,得到一张图上所有区域的得分后使用NMS(每类独立)。特征矩阵是2000x4096,SVM的权重矩阵是4096xN,N是类别个数。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值