一.文献名字和作者
Rich feature hierarchies for accurate object detection and semantic segmentation,CVPR2014
二.阅读时间
2014年12月8日
三.文献的贡献点
1.将卷积神经网络用在从底至上的region proposals上面,从而进行物体定位和分割;
2.使用有监督预训练加上任务相关的微调来进行提升有标签数据有限的任务的性能。
3.1 R-CNN
R-CNN即为regions with CNN,也就是结合了regions proposals的CNN。
R-CNN主要体现在测试阶段,通过selected search算法从测试图片中选择2000个类别无关的区域,然后使用CNN对每个区域进行特征提取,最后使用SVM对每个区域进行分类。
这个部分一直没搞懂selected search是如何整合进整个流程里面的,以及selected search是如何工作的。
在这个过程中,作者提到了一个减少得分区域的方法:greedy non-maximum suppression算法,可以考虑用在减少候选窗口。
3.2 有监督预训练
有监督预训练其实就是迁移学习,将使用其他大规模数据集训练得到的CNN作为初始赋给小数据上面的CNN,修改输出层的数目,然后对这个网络进行有监督的微调,今年CVPR上面很多关于这方面的文章,这个概念也已经不新鲜了。
版权所有,欢迎转载,转载请注明出处,谢谢
