RCNN论文解读

Rich feature hierarchies for accurate object detection and semantic segmentation论文解读

http://blog.youkuaiyun.com/hjimce/article/details/50187029讲得很好,下面再加一点自己的理解。

1、在测试阶段,每个建议框通过CNN获取特征,然后分别用训练好的判断每个类别的SVM得到score,每个类别中得分最高的框开始做非极大抑制,每个类别的非极大抑制是独立的。

2、本方法用同一个CNN提取所有类别的特征,而且特征维度相比于其他方法比较小。

3、提取特征的CNN网络的正负样本的定义和SVM正负样本的定义不一样,提取特征的正负样本的定义为与ground-truth boxes的IOU大于0.5的为正样本,小于0.5的为负样本。SVM的正负样本的定义为IOU小于0.3的为负样本,

这是因为cnn在训练的时候,对训练数据做了比较宽松的标注,比如一个bounding box可能只包含物体的一部分,那么我也把它标注为正样本,用于训练cnn;采用这个方法的主要原因在于因为CNN容易过拟合,所以需要大量的训练数据,所以在CNN训练阶段我们是对Bounding box的位置限制条件限制的比较松(IOU只要大于0.5都被标注为正样本了);

然而svm训练的时候,因为svm适用于少样本训练,所以对于训练样本数据的IOU要求比较严格,我们只有当bounding box把整个物体都包含进去了,我们才把它标注为物体类别,然后训练svm。

4、Much of the CNN’s representational power comes from its convolutional layers, rather than from the much larger densely connected layers.


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值