运行Fast R-CNN的代码
标签(空格分隔): vision
FR-CNN是Ross Girshick的新作,从文章来看FR-CNN比R-CNN和SPPNet都快很多。当然R-CNN和SPPNet也都是Girshick的作品,FR-CNN的正确率不仅超越Girshick自己的嫡出,也超过了DPM等其他方法。
FR-CNN正如文章所说的是一个简单,并且Elegant的框架。和那些Pipeline的模型相比,的确是优雅很多的。当然FR-CNN本身也可以看作是一个Pipeline,只不过这个Pipeline只有两个步骤,一是Pretrain的CNN,第二个是Region Pooling和Fully connected Network(FC)。
我认为优雅之处在于:
- 文章采用了多目标的函数,所以把分类问题和Localization问题一起解决了。
- 最终的目标函数可以用于Fine tune Pretrained CNN (当然也不是每一层都能Train)。这样看起来就是一个统一的框架了。
Contents
Basic Hardware info
- For training smaller networks (CaffeNet, VGG_CNN_M_1024) a good GPU (e.g., Titan, K20, K40, …) with at least 3G of memory suffices
- For training with VGG16, you’ll need a K40 (~11G of memory)
目前的G