第三十九周学习笔记
RCNN论文阅读笔记
原文:Rich feature hierarchies for accurate object detection and semantic segmentation
时间:2014年
文章解决了什么问题
目标检测发展停滞,通过复杂的ensemble模型才能勉强提高一些精度
用了什么方法
两个 insights
- 在bottom-up region proposals中应用卷积神经网络(AlexNet)
- 提出当标签数据少的时候训练神经网络的模式——“supervised pre-training/domain-specific fine-tuning”
三个模块
- category-independent的region proposals
- 提取特征的 large convolutional neural network,在ImageNet上pre-train,然后在目标检测数据集上fine-tune
- 对每个类的SVM二分类器
效果如何
- 在VOC 2010 test上将mAP提升到了53.7%,在VOC 2013上mAP为31.4%,第二OverFeat是24.3%
- 快 13s/image on a GPU 53s/image on a CPU
- 内存占用小,用CNN提取4096维特征,占用的内存小
存在什么不足
?
其他
一些名词
- PASCAL VOC dataset
- DPM
- bounding box regression
- selective search
- hard negative mining method
为什么不直接使用fine-tune之后的CNN来进行分类?
作者做了这样的实验,在VOC2007上mAP从54.2%降低到了41.3%,作者推测可能因为fine-tune时给的数据的定位可能没有做的很好
本周小结
- 论文阅读完成
- opencv3到75%完成
下周任务
- 论文阅读
- 继续学习opencv3上册到100%