
目标检测
文章平均质量分 83
XZZPPP
中国计量大学研究生,图像分类,目标检测,深度学习方向
展开
-
R-CNN学习笔记
1、简介 R-CNN是深度学习在目标检测任务上的应用,其中R对应于“Region(区域)”。整体框架与传统方法相似。 本文两个关键点是:1、使用候选窗口,并用CNN对其进行特征提取;2、样本缺乏时,使用大量辅助样本预先训练,再用自己样本进行微调。 整体框架大致为:生成候选窗口(Selective Search),进行特征提取(CNN),对窗口进行分原创 2016-05-08 15:07:25 · 5976 阅读 · 2 评论 -
Spatial pyramid pooling (SPP)-net (空间金字塔池化)笔记
1、简介空间金字塔池化,使得任意大小的特征图都能够转换成固定大小的特征向量,这就是空间金字塔池化的意义(多尺度特征提取出固定大小的特征向量),送入全连接层。整体框架大致为:输入图像,卷积层提取特征,空间金字塔池化提取固定大小特征,全连接层。具体的流程图如下: 2、具体算法的大体流程 首先通过选择性搜索(selective search),对待检测的图片进行搜索出2000个转载 2016-05-11 19:55:27 · 15750 阅读 · 8 评论 -
Fast R-CNN笔记
1、简介Fast R-CNN将整个图片送入网络时同时将object proposal(这里称为RoI,一张图片中得到约2k个)也送入网络,每一个RoI被Rol pooling layer(相当于一个单层的SPP layer)统一到一个固定大小的feature map,然后通过两个全连接层(FCs)将其映射到一个特征向量。这个特征分别share到两个新的全连接,连接上两个优化目标,第一个是s原创 2016-05-11 20:05:29 · 4416 阅读 · 4 评论 -
CascadeCNN人脸检测学习笔记
原文:A Convolutional Neural Network Cascade for FaceDetection1、简介 CascadeCNN是对经典的Violajones方法的深度卷积网络实现,是一种检测速度较快的人脸检测方法。使用VGA图片,在CPU上达到14FPS,GPU上达到100FPS,在FDDB上达到85.1%的召回率和87%的准确率。2、总体框原创 2016-06-16 16:35:29 · 17874 阅读 · 14 评论 -
Faster R-CNN学习笔记
Faster R-CNN(其中R对应于“Region(区域)” )是基于深度学习R-CNN系列目标检测最好的方法。使用VOC2007+2012训练集训练,VOC2007测试集测试mAP达到73.2%,目标检测的速度可以达到每秒5帧。原创 2016-06-04 08:38:15 · 49960 阅读 · 31 评论 -
Faster rcnn test浮点运算次数(卷积实现过程,Faster rcnn总体结构和参数)
我在调试faster rcnn demo.py的代码后,用监控卡口图片做了测试,并统计了其浮点运算次数(这只是一个粗略的统计,即仅统计了卷积部分乘法运算次数),另外,该代码可以通过pycharm调试,为了能深入理解其内部原理,建议大家动手调试。 上表中,结合protobuf文件,我们知道,layer_name表示层名,bottom表示层输入数据,top表示层输出数据,kernel_si原创 2016-11-24 10:16:11 · 7598 阅读 · 7 评论 -
MTCNN批量读取图片进行人脸和关键点检测,并保存检测结果
本博客在上一篇博客基础上添加了批量处理图片的功能,上一篇博客: Windows下cmake编译caffe,实现纯C++版本MTCNN人脸检测和关键点定位 作者提供的程序是读取摄像头视频,而我需要读取图片,且利用txt文件批量读取图片,分别对每一张图片进行人脸检测和人脸关键点检测,并保存检测结果(也可以显示每张图片效果图)。使用时,替换原来的原创 2017-07-10 14:52:14 · 5135 阅读 · 0 评论 -
Windows下cmake编译caffe,实现纯C++版本MTCNN人脸检测和关键点定位
2017.5.28 发现 caffe官方windows版本已经不提供vs工程文件了,需要用cmake编译生成sln文件。详细编译调试过程如下: 一、开发环境要求: Windows 7/10,64位系统,Visual Studio 2013以上版本,推荐使用VS2015,安装anaconda2.4或以上版本。 二、下载caffe windows版本源码,生成vs原创 2017-06-14 11:06:45 · 13847 阅读 · 13 评论