Fast-RCNN是一个基于深度卷积神经网络(deep ConvNets)实现的快速目标检测框架,代码作者Ross Girshick在RCNN的基础上增加了Multi task training,使得整个的训练过程和测试过程比RCNN快了许多。Fast-RCNN主要有以下特点:
- 训练先进的模型比如VGG16,比RCNN快9倍,比SPPnet快3倍
- 在检测时比RCNN快200倍,比SPPnet快10倍
- 在PASCAL VOC数据集上mAP比RCNN和SPPnet有显著提高
- 基于Python、C++和caffe
1.安装前的准备
caffe
fast-rcnn是基于caffe写的,所以必须要安装caffe,因为rbg的demo是用python写的,所以还要保证pycaffe编译通过。具体的Makefile.config文件请参考这里。安装过程中有可能提示缺少cython,python-opencv,easydict,这些问题我没遇到,这些都是依赖的一些东西,如果遇到请安装一下。GPU
CPU训练和检测速度太慢了,所以我们需要一个好的GPU,作者提供了几种预训练的模型,分别是S号模型CaffeNet,M号模型VGG_CNN_M_1024,这两个模型需要至少3G内存的Titan,K20,K40 GPU。如果训练L号模型VGG16,则必须11G内存的K40,这里我用的是K40的服务器。
2.安装
- clone rbg的代码
要想用fast-rcnn第一步肯定是clone rbg的代码,地址在