论文笔记:RCNN
这是CVPR 2014的一篇经典论文,首次提出R-CNN检测网络,虽然速度很慢,但是在那个时间点已经算是一个开创性的工作了。
简介
这篇文章提出了一个二阶段的方法进行目标检测。第一步通过一个卷积神经网络生成2000个区域提案。第二步通过神经网络提取特征向量;第三步通过SVM将特征向量分类。最后通过非极大值抑制NMS删除IOU大于0阈值的框。
具体实现
区域提案
通过快速模式的选择性搜索获得2000个提案、
特征提取
对于获得的提案,在将区域尺寸变换到227*227(神经网络输入尺寸)之前,先将提案的区域扩充以增加环境信息,并确保尺寸变换之后,环境信息有p像素宽(p=16)。
神经网络对每一个区域提取出一个4096维度的特征向量。
分类
使用一个权重系数矩阵为 4096 × N 4096 \times N 4096×N尺寸的SVM将特征向量分成N类。
训练
CNN用ILSVRC 2012数据进行预训练,使用VOC进行fine-tune。训练分类器时,考虑到样本过多,采用难例挖掘(hard negative mining method)选择样本训练SVM。
性能
一张图片13s(GPU),mAP比之前最好的算法提高了30%