
Object Detection
潇湘_AQ
一颗慢慢成长的小草...
展开
-
论文笔记 Bootstrapping Face Detection with Hard Negative Examples
来自小米研究院的文章。主要介绍了一种优秀的人脸检测技术:采用hard negative mining想法,反复通过背景得到的hard negatives,对Faster RCNN的人脸检测算子进行更新。通过FDDB数据集的验证,该方法效果显著。Related Work:Hard Negative Mining 开始是用在选择function approximation learni原创 2016-08-26 20:30:11 · 4714 阅读 · 2 评论 -
论文笔记 OHEM: Training Region-based Object Detectors with Online Hard Example Mining
CVPR2016的文章,CMU与rbg大神的合作。原谅我一直没有对这篇文章做一个笔记~~文章提出了一种通过online hard example mining(OHEM)算法训练基于区域的卷积检测算子的高效目标检测算法,能够对简单样本和一些小数量样本进行抑制,使得训练过程更加高效。该方法利用显著的bootstrapping技术(SVM中被普遍利用),对SGD算法进行一定的修改,使得原有的reg原创 2016-10-08 22:23:11 · 26741 阅读 · 0 评论 -
论文笔记 R-FCN: Object Detection via Region-based Fully Convolutional Networks
这篇论文主要采用“位置敏感度图”的方法,将FCN 网络引入到目标检测中来,将图像分类和目标检测很好地结合。因此这种方法可以和很多FCN中的图像分类框架结合,比如ResNets等,使其应用到目标检测中来。本文实验了101层的ResNet在VOC数据下结果,取得了mAP 83.6%和 速度 170ms一张图的结果(速度比Faster RCNN快)。原创 2016-11-21 10:03:03 · 4684 阅读 · 0 评论 -
Microsoft COCO 数据集
本篇博客主要以介绍MS COCO数据集为目标,分为2个部分:COCO介绍,数据集分类和COCO展示。本人主要下载了其2014年版本的数据,一共有20G左右的图片和500M左右的标签文件。标签文件标记了每个segmentation的像素精确位置+bounding box的精确坐标,其精度均为小数点后两位。一个目标的标签示意如下:{"segmentation":[[392.87, 27原创 2016-08-30 20:33:49 · 99461 阅读 · 48 评论 -
论文笔记 Fast R-CNN细节
当我决心认真地看Faster R-CNN代码的时候,我就觉得有必要把 Fast R-CNN的论文的细节再从新完整地看一遍了。对,是细节,如何实现的部分,于是有了此篇博客。请注意是 Fast R-CNN笔记。原创 2016-10-15 17:55:13 · 1935 阅读 · 0 评论 -
文献笔记 You Only Look Once:Unified, Real-Time Object Detection
2016_CVPR 文章:You Only Look Once:Unified, Real-Time Object Detection作为深度学习大神 rbg 的又一篇 2016CVPR 论文,迫不及待地学习了,与大家分享1、思路 Overview of YOLORecentapproaches like R-CNN :YOLO detection:A原创 2016-05-11 10:21:09 · 2447 阅读 · 1 评论 -
论文精读 Learning to Segment Object Candidates(一)
Facebook AI Research 的文章,刚刚开源到github。其开源代码主要来自于两篇文章,想学习一下这个代码,还是先把出处的两篇文章看完吧。 经典的目标检测系统主要包括两个部分:提取proposal、将每一个候选proposal输入进行目标分类。本文则提出另一种思路:基于discriminative convolutional network的方法。该模型将两个部分进行合原创 2016-08-27 16:21:19 · 5357 阅读 · 6 评论 -
论文精读 Learning to Segment Object Candidates(二)
Facebook AI Research 的文章,刚刚开源到github,代码: https://github.com/facebookresearch/deepmask 。其开源代码主要来自于两篇文章,想学习一下这个代码,还是先把出处的两篇文章看完吧。接上文(一),该论文的主要思想是将deep-network结构的segmentation与object detection结合,其实验原创 2016-08-28 10:23:51 · 3033 阅读 · 1 评论 -
论文笔记 A MultiPath Network for Object Detection
Facebook一起开源的3个程序之一,MultiPath,其代码网址:https://github.com/facebookresearch/multipathnet。文章简介:这篇文章对于COCO数据集中的小目标难检测问题,主要在Fast RCNN detector的基础上进行了改进,获得了新的detector:MultiPath detector。思想上改进如下:(1)在原创 2016-08-31 19:48:31 · 2066 阅读 · 0 评论 -
论文笔记 MSCNN:A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
最新看到的一篇关于多尺度下快速目标检测的论文,大概得浏览了一下,是UCSD大学的SVCL实验室和IBM研究院一起研究的结果。其代码已经开源到GitHub,链接为:https://github.com/zhaoweicai/mscnn这篇文章主要解决多尺度同时存在时的检索问题,设计了MSCNN网络,提出了两点创新:(1)针对多尺度问题: 类似于FCNT跟踪方法,该文章也是观察原创 2016-09-06 21:32:24 · 11251 阅读 · 2 评论 -
论文笔记 You Only Look Once: Unified, Real-Time Object Detection
今天注意到同组小伙伴写的YOLO的笔记,十分详细,内容丰富,特地和他说了后转载,留着自己也学习一下。相比我之前介绍的YOLO笔记,他的介绍更适合仔细学习,而我原来的适合整体了解。同时,许多训练时的情况的加入,也便于大家的交流学习。原博客地址:http://blog.youkuaiyun.com/u010167269/article/details/52457723 欢迎大家和他或者和我交流~Prefa转载 2016-09-09 22:19:26 · 4217 阅读 · 0 评论 -
论文笔记 SSD: Single Shot MultiBox Detector
话不多说开始总结,作为新一个快速高效的目标检测算法,SSD结合了Faster RCNN和YOLO 算法。本文主要提出的贡献有以下几点:(1)提出SSD算法,比YOLO算法更加迅速,同时和速度较慢的运行region proposal与pooling的算法的精度一样好(包括faster R-CNN) (2)SSD算法的核心是通过使用在特征图上的小卷积滤波器,来预测类别置信度和一系列有误差的boundi原创 2016-09-19 22:27:26 · 8427 阅读 · 4 评论 -
论文笔记 HyperNet: Towards Accurate Region Proposal Generation and Joint Object Detection
提出的HyperNet网络基于设计的Hyper特征,这种特征主要先集合分等级的特征图,然后将其压缩到一个空间。这种Hyper特征同时具有足够深和很好的语义信息,在PASCAL VOC 2007和2012上可以通过每张图产生仅仅100个proposal,而达到很好的精度和效果,同时可以达到实时,GPU下 5 fps的速度。Hyper方法主要的贡献有: (1)在仅仅 50 proposal情况下,可达原创 2016-09-21 22:34:10 · 5206 阅读 · 4 评论 -
论文笔记 G-CNN: an Iterative Grid Based Object Detector
为了目标检测精度和速度的进一步提高,在CVPR2016上各种算法可谓各显神通。今天要说的G-CNN就和YOLO算法类似,着重于速度的提升进行检测算子的改进。而与YOLO不同的是,改算法着眼于初始化proposal数量的减少,使得数以万计的proposal变成极少的初始格网,通过后面不停迭代获得最终较为准确的bbox。原创 2016-09-25 22:52:06 · 5169 阅读 · 4 评论 -
论文笔记 A Large Contextual Dataset for Classification,Detection and Counting of Cars with Deep Learning
ECCV 2016的文章,首先建立了一个从上到下照的车辆影像数据集(即鸟瞰视角),并提出ResCeption神经网络进行训练,进一步建立residual learning with Inception-style layers,进行车辆数目的计算。该方法为车辆数目的计算的一种新方式:通过定位和密度估计方法。原创 2016-09-28 22:52:57 · 1577 阅读 · 1 评论 -
Faster R-CNN代码之 anchors 分析
anchors作为产生proposal的rpn中的一个重点内容,在Faster R-CNN中被重点介绍,下面我们来学习一下anchors产生部分代码。我主要将其中的部分重点代码展示出来。代码引用自Shaoqing Ren的Matlab下Faster R-CNN。原创 2016-09-23 20:43:08 · 3384 阅读 · 0 评论 -
opencv_traincascade 训练自己的分类器
1、准备正负样本首先需要对自己要训练的样本进行准备。样本的准备主要分为两部分:样本+样本描述文件。这里的样本为机器学习类样本,类似imagenet比赛的分类数据样本,一张一张图直接是一个个截取的目标。正样本最好统一大小,尽量resize到比较小的分辨率,训练时候更快消耗内存更少。我这里由于是现有Faster RCNN训练下的样本,有图片和其对应目标位置的xml文件,因为针对xml文件,编写原创 2017-08-22 17:11:52 · 3565 阅读 · 0 评论