py-faster-rcnn 模型介绍
fast-rcnn 是基于SS(selective search)方法提取建议框,而SS方法是基于CPU 运行的,无法借用GPU的高度并行运算能力,效率较低。且提供建议框约2000,过多,加重深度学习处理的压力。
faster-rcnn 采用共享卷积网组成RPN(region proposal network),直接预测出建议框约300个,且预测在GPU中完成,卷积网与fast-rcnn 部分共享,较少参数,大幅提升目标检测速度。Faster-RCNN 把目标检测的四个基本步骤(候选区域生成、特征提取、分类和Bounding BOX 回归) 统一到一个深度网络框架之内。其中候选区域生成由RPN 部分完成,是Faste-RCNN 的创意所在。 提取、分类和Bounding Box 回1等: 三个部分还是沿用了Fast-RCNN。所以说Faster-RCNN 是Fast-RCNN 的升级版本。
py-faster-rcnn 模型编译与测试
- faster RCNN python 安装
- 完美解决ImportError: No module named _tkinter的问题
- sudo apt install python-yaml
- faster-rcnn在编译时遇到的一些问题
- 使用Faster-Rcnn进行目标检测(实践篇)
py-faster-rcnn 模型训练自己数据
- Github : rbgirshick/py-faster-rcnn
- Faster-RCNN+ZF用自己的数据集训练模型(Python版本)
- 生成VOC数据集 https://github.com/tzutalin/labelImg
- caffe示例实现之6微调CaffeNet用于Flickr Style数据集上的风格识别
# 2010、2012数据下载
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2010/VOCtrainval_03-May-2010.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2010/VOCdevkit_08-May-2010.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCdevkit_18-May-2011.tar
使用Python合并lmdb文件 : http://www.jianshu.com/p/7cdec6514b0c
猫狗分类检测
caffe
- Caffe:如何将图片数据转换成lmdb文件
- 神经网络中使用卷积的原因
- github-crnn
- Caffe简介
- 深度学习框架 Caffe 的安装与基本使用
- 人工智能深度学习Caffe框架介绍,优秀的深度学习架构
- LeNet神经网络
卷积操作
多通道(比如RGB三通道)卷积过程
结论:多通道单卷积核是将多通道同一位置卷积结果相加