
Object Detection
steph_curry
这个作者很懒,什么都没留下…
展开
-
读paper——OverFeat
2014年ICLR。overfeat是一个feature extractor。主要特点是网络前5层做特征提取层,后面几层可以修改以适应分类、定位和检测不同任务。两个重要的基础知识:FCN和offset max-pooling。FCN可以满足网络输入任意大小图像的需求。offset max-pooling:作用于layer 5 pooling前的特征图。考虑AlexNet是使...原创 2019-01-22 20:14:39 · 220 阅读 · 0 评论 -
YOLOv3
arxiv18,文章写的很随性, 算是作者的记录性的文章吧。没有太多大的创新,主要是从别的文章里借鉴了几个好的点, 加进去,使YOLOv2的精度进一步提升, 速度下降了一些, 但还可以。YOLOv2的小物体检测问题这里也改善了不少。几个改进:1. Darknet-53 取代Darknet-19, 更深,采用残差网络思想。2. 多尺度检测, 其实YOLOv2采用了passthrough...原创 2019-07-11 14:19:35 · 138 阅读 · 0 评论 -
SSD: Single Shot MultiBox Detector
ECCV2016, 紧接着CVPR16的YOLOv1出的, 在速度不低于YOLOv1的基础上, 精度提升了很多。主要的改进点:1. 多尺度检测, 这点其实在后面FPN等网络种都验证了, 多尺度的feature map检测对精度提升很关键。低分辨率的feature map检测大物体, 高分辨率的检测小物体。SSD300共用了6个feature map。2. 引入RPN的anch...原创 2019-07-11 16:15:52 · 109 阅读 · 0 评论 -
Feature Pyramid Networks for Object Detection
FPN, CVPR17。核心创新点是feature pyramid。传统方法应对尺度变化, 做image pyramid,这样很费时。 其实图像金字塔的作用可以用CNN前向过程中产生分辨率逐渐降低的feature pyramid来代替。这样的想法很自然, 利用feature pyramid可以共享计算, 这样增加的计算量是很小的。 前面也有人尝试这么做,见下图:(b)是一般检测模型...原创 2019-07-11 17:30:01 · 157 阅读 · 0 评论 -
Parallel Feature Pyramid Network for ObjectDetection
ECCV18现在主流的一些检测方法通常使用一个网络来 生成通道数递增的特征,如SSD, 但是这样不同层语义信息差距较大, 会限制检测精度, 尤其是对小目标检测。 作者认为相较于提升深度, 提升网络的宽度更有效。首先使用SPP(spatial pyramid pooling) 来生成不同分辨率的特征, 这些特征是并行生成的,可以认为这些不同尺寸的特征之间有相似的语义信息。 然后我们resiz...原创 2019-07-16 11:16:04 · 317 阅读 · 0 评论 -
Focal Loss for Dense Object Detection
ICCV17.我们知道, 截至17年, 目标检测的方法主要分为两大阵营:two-stage 和one-stage, 前者的代表有RCNN家族, 后者的代表有YOLO和SSD。two-stage的精度在各大数据集上垄断, 而one-stage在精度降低的基础上, 大大提升了速度。那么one-stage方法有没有可能在保持高效率的同时达到和two-stage相匹敌的精度呢?是什么原因导致目前的...原创 2019-07-12 09:06:22 · 105 阅读 · 0 评论 -
Single-Shot Refinement Neural Network for Object Detection
CVPV18 RefineDet这篇文章和focal loss那篇目的是一样的,试图在维持one-stage 方法速度的同时, 提升精度, 赶上甚至超过two-stage。还是分析造成one-stage和two-stage精度差距的原因。 换句话说, two-stage相较于前者的机制上有哪些优点?(1) two-stage RPN结构对class imbalance问题解决的不错, ...原创 2019-07-12 10:43:46 · 190 阅读 · 0 评论 -
Object detection with location-aware deformable convolution and backward attention filtering
CVPR19动机:对multi-scale目标检测来说, context information和high-resolution的特征是很重要的。但是context information一般是不规则分布的,高分辨率特征也往往包含一些干扰的low-level信息。 为了解决这两个问题, 文章提出两个模块: location-aware deformable convolution 和 back...原创 2019-07-12 15:07:41 · 724 阅读 · 0 评论 -
Structure Inference Net: Object Detection Using Scene-Level Context and Instance-Level Relationships
CVPR18这篇文章讨论在检测人物中context的利用, 忽略context的信息是不妥的, 检测问题应该是congnitive问题和reasoning问题的结合。文章提出的方法是在检测框架中嵌入一个Graph模块,其中各个目标物体被视作node, 之间的关系是edge。通过graph来不断refine目标的状态信息。这里的baseline是faster rcnn,可以看到RPN生...原创 2019-07-16 21:52:14 · 260 阅读 · 0 评论 -
Receptive Field Block Net for Accurate and FastObject Detection
这篇文章主要是模拟人类视觉感受野的一些性质, 设计RFB结构加入SSD, 提升了速度与精度。上图是人类群体感受野的size和eccentricity(离心率,这里我理解为离心半径)的关系。 可以看到离中心越远, 感受野大小越大,=右图是一个形象的图示。因此自然地, 我们想要设计一个特征提取模块, 模拟人类感受野的这种性质。作者基于Inception设计了RFB(Receptive F...原创 2019-07-17 10:34:17 · 330 阅读 · 0 评论 -
YOLOv2
CVPR17, 也叫YOLO9000本文实在YOLOv1的基础上改进,达到了'Better, Faster & Stronger'的效果。1. BetterYOLOv1 存在两个问题:a. 很多localization errors.b. low recall.怎么改进呢? 直观的想法是让网络更深, 但是这会让运行速度变慢, 不合适。因此在维持原有网络大小的情况下,...原创 2019-07-11 11:29:20 · 263 阅读 · 0 评论 -
YOLOv1
简单回顾一下detection方面的经典文章,希望能形成一个系统的知识树。自己也不做detection,只是希望能有所借鉴吧。YOLOv1是CVPR16的文章,在此之间以faster rcnn为代表的two-stages检测方法在精度上已经做的不错的,但是以proposal为思想的这些方法,速度上是达不到实时应用程度的。本文提出一种新的架构, 将检测问题看作统一的一个回归问题, 直接从整个图像...原创 2019-07-11 09:52:14 · 176 阅读 · 0 评论 -
读paper——R-CNN
2014年CVPR。R-CNN: Regions with CNN features非极大值抑制:先假设有6个矩形框,根据分类器类别分类概率做排序,从小到大分别属于车辆的概率分别为A、B、C、D、E、F。(1)从最大概率矩形框F开始,分别判断A~E与F的重叠度IOU是否大于某个设定的阈值;(2)假设B、D与F的重叠度超过阈值,那么就扔掉B、D;并标记第一个矩形框F,是我们保留下...原创 2019-01-23 09:25:41 · 482 阅读 · 0 评论 -
读paper——Fast R-CNN
2015年是single-stage的方法。对比R-CNN和SPPnet(2015):R-CNN的缺点:1:multi-stage的流程:三个步骤,finetune——SVM——bbox regressor2: training耗费大量时间和空间3:测试很慢R-CNN之所以这么慢的原因是它检测时要在图片的每一个proposal上运行网络,没有共享计算。SPPnet使用了...原创 2019-01-23 12:40:26 · 188 阅读 · 0 评论 -
faster rcnn
转自https://www.cnblogs.com/wangyong/p/8513563.html下面的介绍都是基于VGG16 的Faster RCNN网络,各网络的差异在于Conv layers层提取特征时有细微差异,至于后续的RPN层、Pooling层及全连接的分类和目标定位基本相同.一)、整体框架我们先整体的介绍下上图中各层主要的功能1)、Conv layers提取...转载 2019-04-01 21:40:33 · 200 阅读 · 0 评论 -
Assisted Excitation of Activations: A Learning Technique to Improve Object Detect
CVPR2019很简单的一篇文章,不是在网络结构设计或者loss上做改进, 而是提出一种简单的学习策略。它基于curriculum learning的思想:如果我们先学习简单的任务, 再学习复杂的任务, 我们会取得更好的效果。以YOLO为例:在YOLO的网络中加入这样的辅助激发层(AE)。 它根据ground truth的位置, 在原有特征图上激发对应位置(实质也是attenti...原创 2019-07-12 21:05:36 · 752 阅读 · 2 评论 -
Mask R-CNN
基于faster rcnn的实例分割模型, 当然它也是一个通用性很强的模型, 可以扩展用于目标检测、人体关键点检测等。较于faster的改动是,head 部分除了classification和regression外, 增加了预测实例分割的mask的分支,增肌了很少的计算成本,效果却很显著。考虑到faster rcnn中ROI Pooling存在量化误差, 使得前后像素不匹配,这对检测来说,...原创 2019-07-10 10:26:00 · 123 阅读 · 0 评论 -
Libra R-CNN: Towards Balanced Learning for Object Detection
CVPR19, 关注目标检测训练过程的优化, 而不是网络框架的改进。我觉得这是一个方向……作者认为, 现在的检测训练中有三处不平衡:采样不平衡、 特征不平衡和目标函数不平衡:1. 采样不平衡:存在的问题和前面讲的focal loss文章解决的问题一样: easy negtive example太多, 在梯度计算中占主导位置, hard negtive example得不到良好训练。解决...原创 2019-07-14 10:24:43 · 262 阅读 · 0 评论 -
Distilling & Exploring
Distilling Object Detectors with Fine-grained Feature ImitationExploring the Bounds of the Utility of Context for Object Detection两篇CVPR19文章。 没细看, 主要是关注一下他们做的方向和提出的一些结论。第一篇是Knowledge distillatio...原创 2019-07-14 11:24:43 · 206 阅读 · 0 评论 -
Adaptive NMS: Refining Pedestrian Detection in a Crowd
这两年不少人在做NMS的优化工作。NMS是检测的后处理工作,在RCNN系列算法中,会从一张图片中找出很多个候选框(可能包含物体的矩形边框),NMS就是去除冗余矩形框的过程。具体流程如下:对于Bounding Box的列表B及其对应的置信度S,采用下面的计算方式.选择具有最大score的检测框M,将其从B集合中移除并加入到最终的检测结果D中.通常将B中剩余检测框中与M的IoU大于阈值Nt的框从B...原创 2019-07-14 15:12:39 · 1587 阅读 · 4 评论 -
Scale-Transferrable Object Detection
ECCV18还是做检测中尺度变化问题。(a)是faster rcnn的做法;(b)是FPN的做法, 这个结构要小心设计, 同时计算成本上升,影响速度;(c)是SSD的做法, 底层没有利用到高层的语义信息, 对小物体检测能力有限;(d)是本文方法, 左边是DenseNet生成的一系列特征图, DenseNet每一层生成的特征分辨率相同, 利用池化层处理得到小分辨率图, 同时具...原创 2019-07-14 16:04:49 · 193 阅读 · 0 评论 -
Semantic Graph Convolutional Networks for 3D Human Pose Regression
CVPR19从2d坐标估计3d坐标, 这个参照17年ICCV A simple yet effective baseline for 3d human poseestimation, 它证明了在2d坐标足够精确的情况下, 是可以估计出较为精确的3d坐标的。本文结合了GCN, 加上Non-local layer。Method 2D Detections # of Epo...原创 2019-07-22 23:57:32 · 1279 阅读 · 0 评论