
detection
爆米花好美啊
个人网站: renguanghui.com
展开
-
FPN解读
前两篇博客中都说到了FPN这个神器,今天就花了点时间看了下这篇论文,喜欢这个很赞很干净的结构。原创 2017-11-29 00:34:41 · 27438 阅读 · 19 评论 -
Focal Loss for Dense Object Detection解读
还是Tsung-Yi Lin Piotr Dollar kaiming ross他们在Detection领域做的贡献Focal Loss for Dense Object DetectionMotivationsingle stage的检测方法如YOLO、SSD等简单高效,但是精度往往不如two stage的如Faster/Mask RCNN,本文发现single stage不如t...原创 2018-06-24 17:29:54 · 2848 阅读 · 4 评论 -
An Analysis of Scale Invariance in Object Detection – SNIP解读
今天无意中看到这篇好文,在网上搜索时发现Naiyan Wang也在知乎上推荐了,还中了CVPR2018的oral,佩服!Introduction这篇文章首先想探讨一个问题:scale变化对识别和检测的影响,然后就是upsample对于小物体的检测有用嘛?根据这两个问题的分析,本文提出了一种端到端的Image Pyramid Network,然后针对大物体在大尺度的图片上、小物体在小...原创 2018-07-03 17:27:03 · 4064 阅读 · 0 评论 -
SNIPER: Efficient Multi-Scale Training解读
它算是An Analysis of Scale Invariance in Object Detection-SNIP的增强版,依然在思考怎么能更好的解决检测中的多尺度问题IntroductionRCNN本身具有很好的尺度不变形,因为它先从图片中提取proposal,然后都resize到224去提取特征但是这样每个proposal不共享特征的计算,很慢,而Fast系列为了解决这...原创 2018-07-04 00:10:29 · 11502 阅读 · 2 评论 -
faster rcnn源码解析
之前一直是使用faster rcnn对其中的代码并不是很了解,这次刚好复现mask rcnn就仔细阅读了faster rcnn,主要参考代码是pytorch-faster-rcnn ,部分参考和借用了以下博客的图片 [1] CNN目标检测(一):Faster RCNN详解姊妹篇mask rcnn解析整体框架首先图片进行放缩到W*H,然后送入vgg16(去掉...原创 2017-11-20 23:50:01 · 40097 阅读 · 17 评论 -
Revisiting RCNN: On Awakening the Classification Power of Faster RCNN
之前听过该文作者Yunchao Wei给的一个talk,当时仔细思考这篇论文,只是感觉加了参数肯定会变好呀,但是实际上该文在探索检测任务中分类和定位的关系。实际上,检测任务中有很多值得探讨的东西,比如之前博客讲过的一篇论文在探究训练和测试尺寸一致的问题,这些点看似都很小,但是我之前一直都是猜测得出结论,没有仔细探究过,分割也有这样的问题。还有就是Multi Task的好处与坏处,比如分割中前背景...原创 2018-12-06 11:52:35 · 1965 阅读 · 4 评论 -
Mask RCNN细节记录
精度问题在FPN论文中有个表格显示 C5+2fc要比C4+C5差很多,这里的原因一是C5+2fc的stride为32,feature map太小了,anchor数量也少,RPN的召回率太低了,第二个原因应该是RoIPooling造成的偏差影响更大了,因为stride太大了(这个原因待定,不知道对box分支的影响有多大,但可以肯定的是对mask 分支影响很大,下面会细讲)下面这个表格来自Ma...原创 2018-12-20 16:40:54 · 1025 阅读 · 0 评论 -
Deformable Convolutional Networks解读
这篇论文是daijifeng老师又一篇好文,一贯的好想法,而且实现的很漂亮。原创 2017-12-14 17:42:22 · 16521 阅读 · 15 评论 -
Deformable ConvNets v2: More Deformable, Better Results
之前介绍过dai老师的DCN v1Deformable Convolutional Networks解读,现在出了V2效果更赞,实验分析也很充分。分析DCNEffective receptive fields视野域中每个点对响应的不同,有效视野域即为输入扰动后对输出的影响程度。比如求conv2上某一位置的有效视野域,那就依次扰动图像观察该位置处的输出变化,导致输出变化剧烈的像素点它的...原创 2018-12-11 13:56:32 · 1421 阅读 · 1 评论 -
anchor free系列检测方法
one stage和two stage是目标检测的主流方法,最近由deng老板引领的anchor free方法另辟蹊径,以关键点检测为基础来做检测,也算是one stage的一种吧CornerNetExtremNetCenterNet(Objects as Points)超喜欢的一篇工作...原创 2019-04-29 16:33:10 · 7580 阅读 · 0 评论 -
Learning to Segment Every Thing解读
kaiming ross他们一块的又一篇文章,基于mask rcnn的做的一个扩展,他们真是一直在推进着Detection Segmentation领域的发展Introduction目前做instance segmentation的方法都需要像素级标注,这样的话就很难有一个类别数目庞大的库做支撑,因为像素级标注太费人力物力财力了,已有的coco也只有80类,pascal voc只有...原创 2018-06-21 19:14:53 · 3195 阅读 · 0 评论 -
利用光流提升视频识别的速度和精度
daijifeng老师的两篇文章,利用光流提升视频识别的速度Deep Feature Flow for Video Recognition,利用光流提高视频的精度Flow-Guided Feature Aggregation for Video Object Detection,关于光流可参考我之前的博客光流介绍以及FlowNet学习笔记Deep Feature Flow for ...原创 2018-04-03 11:59:39 · 10753 阅读 · 4 评论 -
YOLO解读
上一篇讲了region-free结构的检测模型SSD,这次region-free的鼻祖You Only Look Once: Unified, Real-Time Object Detection,这是它的第一个版本,它还有v2,以后再讲。原创 2017-11-30 17:03:50 · 5049 阅读 · 0 评论 -
R-FCN解读
最近一直做检测,发现检测领域好多好玩的东西啊,R-FCN是msra dai老师和kaiming做的,insight很赞,这次翻出来再学习一下。最近旷视科技又发了light RCNN,检测这领域真是日新月异。原创 2017-11-25 16:05:00 · 11624 阅读 · 0 评论 -
Light-Head R-CNN解读
detection新作Light-Head R-CNN原创 2017-11-27 20:48:36 · 1294 阅读 · 0 评论 -
mask rcnn解读
上一篇中介绍faster rcnn,这次mask 基本在上次的基础上加了点代码,参考和引用1. mask rcnn slides 2. kaiming he maskrcnn 3. Ardian Umam mask rcnn,欢迎fork简版mask rcnn。原创 2017-11-21 00:08:52 · 16255 阅读 · 11 评论 -
FSSD解读
本文是SSD的改进版,算是SSD+FPN思想的结合。原创 2017-12-28 21:54:02 · 19444 阅读 · 5 评论 -
SSD: Single Shot MultiBox Detector解读
此SSD非彼SSD,不过都有一个特点快,我之前读过了这篇,这次算是重温,而且前面介绍了很多检测网络,尤其是FPN时更是对SSD有一个很根本的解读,所以这篇博客算是一个SSD精华介绍,哈哈。贡献和特点SSD最大的贡献,就是在多个feature map上进行预测,这点我在上一篇FPN也说过它的好处,可以适应更多的scale。第二个是用小的卷积进行分类回归,区别于YOLO及其faster原创 2017-11-29 23:22:33 · 4897 阅读 · 8 评论 -
RoIAlign源码解析
RoIAlign源码及示意图/** 参数解释* bottom_data 需要做RoIAlign的feature map* spatial_scale feature map放缩的尺寸 vgg是1/16* channels height width feature map的通道高和宽不用多说* pooled_height pooled_width RoIAlign后的feature原创 2018-02-01 20:31:31 · 6774 阅读 · 0 评论 -
Relation Networks for Object Detection解读
现在做detection的竞争相当激烈,能记住的就是ross kaiming团队和sunjian老师团队,还有今天的主角daijifeng老师团队了arxiv linkMotivation众所周知,如果能model出物体之间的关系,那么对物体识别是大有裨益的。可是在深度学习领域上还没人把这个做work,当前主流的检测模型faster rcnn等都是使用RoIPooling后独立...原创 2018-03-09 15:06:38 · 5654 阅读 · 0 评论 -
Path Aggregation Network for Instance Segmentation解读
本篇论文是COCO 2017 instance segmentation的冠军,读了这篇论文再加上之前读论文的体会,和朱神交流后得到一个感悟: 同样一个work的小改动,你不能挖的深或者看得很浅,那你就是trick,而别人就能给科研界带来启发,ResNet很简单,但是kaiming他们就能把解决的问题和起因经过解释的很清楚,然后实验也很solid,给你一步一步解释,但是方法是十分简洁的。ar...原创 2018-03-08 16:32:38 · 13508 阅读 · 3 评论 -
TridentNet解读
检测领域一直存在一个scale variation问题,大小物体对视野域的需要是不一样的,deformable cnn的作者daijifeng老师就提到一个说法:最好的视野域就是刚好“覆盖自己”,不要太大也不要太小。前人有3种途径利用RCNN去原图上扣proposal,强制使得所有物体的视野域就是自己 Revisiting RCNN: On Awakening the Classificat...原创 2019-04-25 12:01:56 · 2214 阅读 · 0 评论