运行Fast R-CNN的代码
标签(空格分隔): vision
FR-CNN是Ross Girshick的新作,从文章来看FR-CNN比R-CNN和SPPNet都快很多。当然R-CNN和SPPNet也都是Girshick的作品,FR-CNN的正确率不仅超越Girshick自己的嫡出,也超过了DPM等其他方法。
FR-CNN正如文章所说的是一个简单,并且Elegant的框架。和那些Pipeline的模型相比,的确是优雅很多的。当然FR-CNN本身也可以看作是一个Pipeline,只不过这个Pipeline只有两个步骤,一是Pretrain的CNN,第二个是Region Pooling和Fully connected Network(FC)。
我认为优雅之处在于:
- 文章采用了多目标的函数,所以把分类问题和Localization问题一起解决了。
- 最终的目标函数可以用于Fine tune Pretrained CNN (当然也不是每一层都能Train)。这样看起来就是一个统一的框架了。
Contents
Basic Hardware info
- For training smaller networks (CaffeNet, VGG_CNN_M_1024) a good GPU (e.g., Titan, K20, K40, …) with at least 3G of memory suffices
- For training with VGG16, you’ll need a K40 (~11G of memory)
目前的G

本文档详细记录了在Ubuntu 14.04上运行Fast R-CNN代码的步骤,包括基本硬件需求、系统信息、安装Opencv、Caffe以及Fast R-CNN框架。在资源有限的环境下,作者在CPU上成功运行了代码,并遇到了skimage.io和google.protobuf.internal模块导入错误,但最终解决问题并实现了对图像中车辆的识别。尽管仍存在一些代码理解上的困惑,但Fast R-CNN的表现令人满意。
最低0.47元/天 解锁文章
2606

被折叠的 条评论
为什么被折叠?



