
物体检测
Object detection related paper notes
code-life
code-life
展开
-
论文:FCOS: Fully Convolutional One-Stage Object Detection 阅读笔记
一、论文(19)FCOS: Fully Convolutional One-Stage Object Detectionhttps://arxiv.org/abs/1904.01355code: https://tinyurl.com/FCOSv1二、论文笔记1、背景(1)、anchor-based 需要设置的超参数太多了,而且超参数很影响最后的结果(比如cascade ...原创 2019-06-23 16:31:55 · 629 阅读 · 0 评论 -
论文:Training Region-based Object Detectors with Online Hard Example Mining 阅读笔记
一、论文(19)Training Region-based Object Detectors with Online Hard Example Mininghttps://arxiv.org/abs/1604.03540二、论文笔记1、背景(1)、现存的网络的启发式方法和超参数需要花费很多时间去调。(2)、数据集的样本有很多简易样本,以及一小部分的困难样本。(3)、传统...原创 2019-06-22 18:04:47 · 256 阅读 · 0 评论 -
论文:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记
一、论文(19)Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regressionhttps://arxiv.org/abs/1902.09630code:https://giou.stanford.edu二、论文笔记1、背景(1)、深度神经网络的优化,目前主要集中在网络结...原创 2019-06-21 23:00:16 · 263 阅读 · 0 评论 -
论文:Bag of Freebies for Training Object Detection Neural Networks
一、论文(19)Bag of Freebies for Training Object Detection Neural Networkshttps://arxiv.org/abs/1902.04103code: https://github.com/dmlc/gluon-cv二、论文笔记1、背景(1)、简单的有效的训练方式,就可以再不增加任何inference时间的情况下...原创 2019-06-20 17:48:11 · 375 阅读 · 0 评论 -
论文:Segmentation Is All You Need 阅读笔记
一、论文Segmentation Is All You Needhttps://arxiv.org/abs/1904.13300二、论文笔记1、基于RPN的方法对于图片里边一些特殊情况的物体的检测效果很差(召回率很差),比如这三种效果差主要有两个原因:(a)RPN高度依赖bounding box, 但是对于一些极端的例子,人工标注的ground truth ...原创 2019-05-30 17:32:01 · 966 阅读 · 0 评论 -
论文:Deformable ConvNets v2 阅读笔记
一、论文Deformable ConvNets v2: More Deformable, Better Resultshttps://arxiv.org/abs/1811.11168The code for DCNv2will be released.二、论文笔记1、背景a)、基于第一版的问题, 使用可变形卷积发现网络确实学会了适应物体的形状然后去关注不同形状物所覆盖的区...原创 2019-05-29 16:27:48 · 463 阅读 · 0 评论 -
论文:Feature Selective Anchor-Free Module for Single-Shot Object Detection 阅读笔记
一、论文Feature Selective Anchor-Free Module for Single-Shot Object Detectionhttps://arxiv.org/abs/1903.00621https://www.cnblogs.com/fourmi/p/10602936.html二、论文笔记1、背景a)、作者提出了一个FSAF网络结构块(feature...原创 2019-05-27 15:48:14 · 487 阅读 · 0 评论 -
论文:CornerNet: Detecting Objects as Paired Keypoints 阅读笔记
一、论文CornerNet: Detecting Objects as Paired Keypoints论文:https://arxiv.org/abs/1808.01244代码: https://github.com/princeton-vl/CornerNet二、笔记1、背景a)使用anchors的one stage 方法有两个缺点:(1)大量的anchor box 降...原创 2019-05-27 15:46:58 · 187 阅读 · 0 评论 -
论文:Cascade R-CNN: Delving into High Quality Object Detection 阅读笔记
一、论文Cascade R-CNN: Delving into High Quality Object Detectionhttps://arxiv.org/abs/1712.00726https://github.com/zhaoweicai/cascade-rcnn二、论文笔记1、背景a)、阈值设的太小,正负样本比例失衡,负样本太多,使得检测器对于有较大的阈值的错误框...原创 2019-05-25 19:15:11 · 264 阅读 · 0 评论 -
论文:CenterNet: Keypoint Triplets for Object Detection 阅读笔记
一、论文CenterNet: Keypoint Triplets for Object Detectionhttps://arxiv.org/abs/1904.08189code:https://github.com/Duankaiwen/CenterNet二、笔记1、背景1)、anchor-based方法anchor方法的复杂性2)、cornernet没有好好利...原创 2019-05-23 20:58:50 · 444 阅读 · 0 评论 -
论文:Mask R-CNN 阅读笔记
一、简介Mask R-CNN是一个实例分割(Instance segmentation)算法,可以用来做“目标检测”、“目标实例分割”、“目标关键点检测”。整个Mask R-CNN算法的思路很简单,就是在原始Faster-rcnn算法的基础上面增加了FCN来产生对应的MASK分支。即Faster-rcnn + FCN,更细致的是 RPN + ROIAlign + Fast-rcnn + F...原创 2018-06-17 14:52:32 · 460 阅读 · 0 评论 -
论文:R-FCN: Object Detection via Region-based Fully Convolutional Networks 阅读笔记
一、简介1、R-FCN可以看做是Faster RCNN的改进版,速度上提高了差不多3倍左右,mAP也有一点提升,主要的目的是进行了加速2、当然这个算法还是属于候选窗+深度学习分类和回归系列的,也就是会包含rpn网络给出候选框建议。3、下面的这个表是共享参数的层数这篇讲解的很棒二、原理1、这篇论文是NIPS 2016的一篇论文,主要贡献在于解决了“分类网络的...原创 2018-06-16 17:12:46 · 387 阅读 · 0 评论 -
论文:Feature Pyramid Networks for Object Detection 阅读笔记
一、简介引用:http://hellodfan.com/2017/10/14/%E7%89%A9%E4%BD%93%E6%A3%80%E6%B5%8B%E8%AE%BA%E6%96%87-SSD%E5%92%8CFPN/二、流程在RPN+FAST R-CNN里边 嵌入FPN的流程图1、第一种不知是不是存在,与第二种的差别,就是最后的rol不是在不同的层级的feature ...原创 2018-06-16 00:00:59 · 1094 阅读 · 0 评论 -
SPP-Net
一、简介主要贡献就是添加了金字塔层,可以应对不同大小的输入。二、过程1、首先通过选择性搜索,对待检测的图片进行搜索出2000个候选窗口。这一步和R-CNN一样。2、 特征提取阶段。这一步就是和R-CNN最大的区别了,这一步骤的具体操作如下:把整张待检测的图片,输入CNN中,进行一次性特征提取,得到feature maps,然后在feature maps中找到各个候选框的区域,再对各个候选框采用金字...原创 2018-06-15 13:46:48 · 304 阅读 · 0 评论 -
YOLO v1
基本上看了别人的博客和论文,自己再总结一些细节。一 、yolo v1yolo 最重要的一个特点是划分格子,这个只是我们让网络自动适应学习的一个规则,实际上我们并不会在图像上进行划分,输入的时候,我们输入的还是一整张的图片。然后输出的的时候,是按预想的格子输出的,比如划分为7*7的格子,那我们最后的输出就是7*7*30。这样好像输出的每一个长条向量(30)好像就对应图像上划分的一个格子。实际上,最后...原创 2018-06-15 13:39:36 · 206 阅读 · 0 评论 -
Faster R-CNN
这三篇就够了引用1、http://shartoo.github.io/RCNN-series/2、http://hellodfan.com/2017/10/02/%E7%89%A9%E4%BD%93%E6%A3%80%E6%B5%8B%E8%AE%BA%E6%96%87-Faster-R-CNN/3、https://blog.youkuaiyun.com/hellor123/article/details/7...原创 2018-06-15 13:35:20 · 258 阅读 · 0 评论