- 博客(35)
- 资源 (4)
- 收藏
- 关注
原创 【论文】人工智能前沿论文集
2020.2.16https://zhuanlan.zhihu.com/p/107060834,https://arxiv.org/pdf/2002.05709.pdfHinton组力作:ImageNet无监督学习最佳性能一次提升7%,媲美监督学习。https://www.zhihu.com/question/355779873,https://arxiv.org/pdf/1911...
2020-02-16 16:19:23
1067
原创 【实验】bayes nms的缺点
0.实验设计首先通过ap指标来分析为什么bayes nms的效果差(在faster上面),之后结合nms动画来具体分析原因。1. 整体序号AP/AR说明NormalBayes1Average Precision (AP)@[ IoU=0.50:0.95 area= all maxDets=100 ]0.3770.3712Average Prec...
2019-12-25 16:52:31
614
原创 【论文】【实例分割】YOLACT
YOLACT: Real-time Instance Segmentationhttps://arxiv.org/abs/1904.02689https://zhuanlan.zhihu.com/p/62652145We present a simple, fully-convolutional model for real-time instance segmentation tha...
2019-10-16 09:48:49
554
原创 【其他】【思考】目标检测与mAp(1)
一、mAp(mean average precision)这一部分分析常见的mAp的计算方法。首先来介绍最常用的mAp计算方法(VOC2012中所用到的)。先做一个概述:检测器对每一张图片进行检测,给出DR b-box将所有图片的DR b-box集中,按照DR b-box给出的label进行分类对于每个类别: 将属于该类别的DR b-box按confidence降序排...
2019-10-15 14:24:09
429
原创 【论文】YOLO(You Only Look Once: Unified, Real-Time Object Detection)简介
一、简介在YOLO之前所采用得方法,通常是两个阶段(two-stage)的检测方法,首先生成大量的bbox(bounding box),之后根据bbox在特征层上的映射来进行分类(classification)以及进一步的bbox位置修正(regression)。而YOLO将目标检测问题化为了一个回归问题,直接从图像映射得到bbox和类别概率。它相比two-stage的方法有两个有点:1.快。...
2019-10-15 14:23:41
372
原创 【论文】R-FCN: Object Detection via Region-based Fully Convolutional Network总结
一、简介R-FCN是一个与faster r-cnn有类似结构的two-stage网络,首先通过一个网络共同提取特征,之后通过一个RPN来提出候选框,然后对候选框进行微调以及对物体进行识别。RPN与faster r-cnn一样,改变的是后面的网络,R-FCN使用了一种全卷积网络结构,降低了最后一层全连接层所带来的速度影响,而且提出了两个概念:translation-invariance以及tr...
2019-10-15 14:23:09
198
原创 【论文】目标检测中正负样本的选取总结
一、简介目标检测有大量的算法,这篇文章对其中正负样本的选取方法进行了总结。对于正样本,是回归与分类都进行,而负样本由于没有回归的对象,不进行回归,只进行分类(分类为背景)。二、正文1.Fast R-CNN构造如下:步骤是1.selective search -> ROIs -> 筛选 -> ROIs2.ROIs + feature map -&g...
2019-10-15 14:21:30
6906
原创 【实验】SNIP实验
1.SNIP1. 训练测试分辨率的domain shift这里的domain shift指的是测试和训练的图像分辨率不一致。实验目的探究该domain shift(测试和训练的图像分辨率不一致)的影响,并比较两种解决方案。实验:·网络名称训练测试CNN-B224*224先下采样到48* 48,64* 64, 80* 80, 96* 96, 128*128。之后...
2019-10-15 14:15:35
403
原创 【代码】mmdetection源码解读(Anchor head部分)
0.简介Anchor head主要是为了计算基于Anchor的损失函数,以及简单的回归。其中含有两个单层卷积,一个用来分类,一个用来回归,可以添加多层, 例如Retina head。以下代码的解读均依靠断点调试获得,使用的模型为faster r-cnn1.self.loss def loss(self, cls_scores, bb...
2019-10-15 14:08:58
3279
4
原创 【论文】Paper List
FSAF: Feature Selective Anchor-Free Module for Single-Shot Object Detection两个部件:anchor free 模块,layer选择模块。FreeAnchor:
2019-10-15 13:56:50
339
原创 【代码】【未完】COCO评价准则的Python代码解读
cocoeval.py的COCOeval类1. _prepare载入gts和dts,这两个都是列表,每一个元素包含bbox,img_id,类别等信息。如果存在ignore_id的话,将对应gt的’ignore’设置为TRUE self._gts = defaultdict(list) # gt for evaluation self._dts ...
2019-10-15 13:48:44
1503
1
原创 【代码】FoveaBox代码解读
0. FoveaBox论文: https://arxiv.org/abs/1904.03797代码;mmdetection1. _init_layers网络结构:reg_convs:4个卷积层cls_convs:4个卷积层,如果有deformable卷积。则有2个卷积,一个deform2. loss获得各layer中feature_map的shape,featmap_siz...
2019-10-14 16:25:23
860
3
原创 【实验】COCO数据集上的实验
1.MMdetection上的实验1.1 cascade_rcnn_x101CUDA_VISIBLE_DEVICES=3 python ./tools/test.py ./configs/cascade_rcnn_x101_64x4d_fpn_1x.py ./checkpoints/cascade_rcnn_x101_64x4d_fpn_2x_20181218-5add321e.pth --o...
2019-08-21 19:19:22
3360
7
原创 【代码】mmdetection中的mmdet.datasets
1.collate1.collate用来拼接batch中的数据。与标准的pytorch中的default_collate不同,这里的collate返回的是一个列表,每个列表中的元素是一个minibatch,应该是为了用于多个gpu,每个gpu上运行一个minibatch。collate支持对于DataContainer数据类型的操作,对于meta data,直接拼成minibatch,返回...
2019-08-15 21:26:42
6718
2
原创 【代码】mmdetection框架
0.前言这篇文章是使用mmdetection的记录,记录对于代码、设计理念的个人理解。1.记录使用tools.train进行训练。添加如下代码来使用debug模式: import os os.environ["CUDA_VISIBLE_DEVICES"] = "4" args = ['./configs/cascade_mask_rcnn_r101_fpn_1x.py...
2019-08-14 21:48:48
2091
原创 【代码】CenterNet使用(续)(对五六七部分详解)(七)
接上面部分,对五六七部分进行详解,这篇介绍第七部分。一、回顾第七部分进行最后的后处理: results = self.merge_outputs(detections) torch.cuda.synchronize() end_time = time.time() merge_time += end_time - post_process_time ...
2019-07-25 16:54:31
2963
3
原创 【代码】CenterNet使用(续)(对五六七部分详解)(六)
接上面部分,对五六七部分进行详解,这篇介绍第六部分。一、回顾第六部分对得到得dets进行后处理: dets = self.post_process(dets, meta, scale) torch.cuda.synchronize() post_process_time = time.time() post_time += post_pr...
2019-07-25 16:54:28
1904
4
原创 【代码】CenterNet使用(续)(对五六七部分详解)(五)
接上面部分,对五六七部分进行详解,这篇介绍第五部分,也就是model从建立到测试,数据从images到output、dets的详细过程。一、回顾第五部分放入网络中测试,产生输出: output, dets, forward_time = self.process(images, return_time=True)process部分在ctdet.py中: def...
2019-07-25 16:54:22
3494
10
原创 【代码】CenterNet使用(Detection)(demo.py)
一、运行demo.py按照readme里头的创建一个新环境,按照要求安装即可,中间也遇到了不少的问题,比如说一开始装上了torch0.4.1,之后不能安装torchvision,所以又升到了torch1.0,安装完torchvison之后又回退到了torch0.4.1版本。中间也遇到过DCNv2编译失败的情况,把失败的DCNv2删掉后再重新编译,安装了一些必要组件,好像是那个ffi的模块,然后...
2019-07-25 16:54:19
5038
15
原创 【代码】CenterNet的使用
一、数据集的准备(PASCOL VOC)首先将src/tools/get_pascal_voc.sh中涉及的数据集和工具都下载下来,之后在tools中建立voc文件夹,将数据集和工具放入到voc中,运行修改后的脚本:cd voctar xvf VOCtrainval_06-Nov-2007.tartar xvf VOCtest_06-Nov-2007.tartar xvf VOCd...
2019-07-25 16:54:14
2715
6
原创 【论文】SNIP - An Analysis of Scale Invariance in Object Detection
1.问题COCO数据集中存在的两个问题:1.大量小物体 2.尺度变化极大Therefore,most object instances in COCO are smaller than 1% of imagearea! To make matters worse, the scale of the smallest and largest 10%of object instances i...
2019-07-17 21:50:06
364
原创 【代码】CenterNet代码解析
这篇文章主要就是介绍一些用到的重要的函数,只介绍detection部分。0.网站https://github.com/xingyizhou/CenterNetinstall:https://github.com/xingyizhou/CenterNet/blob/master/readme/INSTALL.mddataset:https://github.com/xingy...
2019-06-14 16:56:16
20801
25
原创 【代码】NMS
# --------------------------------------------------------# Fast R-CNN# Copyright (c) 2015 Microsoft# Licensed under The MIT License [see LICENSE for details]# Written by Ross Girshick# --------...
2019-05-16 13:13:36
390
原创 【论文】Cascade R-CNN总结
一、简介Cascade R-CNN是为了解决训练时用来定义FP和TP的IOU值选取的问题,并且提出了一种结构来利用该IOU值不同所带来的好处,贡献体现在对于定位能力的改进上,也就是IOU值。一般而言,这个值定为了0.5,那么其他的值呢?作者做了实验,观察到以下现象:其中,图(d)中绘制的是随着定义TP的IOU阈值的变化,根据不同的u训练出来的检测器,AP的变化。可以看出来,在IO...
2019-04-08 11:13:51
1436
1
原创 【论文】YOLOv2
这里只简要介绍一下YOLOv2,谈谈想法。关于YOLOv2,下面的这篇介绍的已经很详尽了:https://www.jianshu.com/p/032b1eecb335首先罗列一些它做了什么:从上往下数:1.BN,在所有的卷积层后面添加BN层,移除dropout2.high resolution classifier,在高分辨图像上对分类网络finetune3.co...
2019-04-03 16:38:52
356
原创 【论文】OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks总结
趁热打铁,把OverFeat总结了。一、简介这个文章中提出了一种较为通用的结构,并将其应用在了识别(classification)、定位(localization,只有一个物体,要给出位置)、检测(detection,可能有0到多个物体)。并且将其使用的特征提取器命名为了OverFeat(仅仅是一个名字,文中也没有给出解释)。这篇论文或许是很早一批将CNN利用到多种不同任务上的一种尝试,因...
2019-03-30 11:27:04
300
原创 【论文】SPP(Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition)
本来是打算总结R-FCN的,但是我发现SPP和Over-Feat在很多地方都有提到,所以先对这两个东西进行一个总结。SPP网络的思想很简单,但是这篇论文却写出了很多东西,这一点很值得学习。一、简介SPP的提出是为了解决CNN固定输入的问题,这导致了在面对不同大小图片的时候,它只能使用裁剪或者缩放的方法获得与CNN输入大小一致的图片,但是这些方法会对物体产生形变,会丢失信息。SPP有几个很...
2019-03-29 21:16:32
766
原创 【论文】SSD: Single Shot MultiBox Detector简介
一、简介SSD提出于2016年三月20日,比YOLO v1早两个月,但是它其中提到了YOLO,所以应该是比YOLO晚的。SSD也是一个one stage方法,它其中的改进包括:1.使用小卷积及取预测类别和定位偏差,2.使用不同的filter去对于不同宽高比(aspect ratio)进行判断,3.在多个feature map上进行判断。二、基本思想对于每个feature...
2019-03-28 22:42:21
283
原创 【论文】YOLOv1
YOLOv1的结构很简单,和一般的分类网络差别不大。主要是损失函数的设计以及对于训练过程的设计,还有就是网络输出代表的含义。YOLOv1的输出是一个7*7的矩阵,它假设网络相应index的输出对应于输入图片相应的grid,每个index对应几个b-box,这个b-box是有限定的,它的中心处于grid中,因此我们的目标之一应该是是判断grid中是否包含某个物体的中心,假如中心没有包含在gr...
2019-03-28 15:31:37
199
原创 【其他】【思考】目标检测的目标以及mAp(0)
一、简介目标检测(object detection)是一个CV中一个经典的问题,相对于物体识别任务而言,它更加的复杂,应用也更加的广泛。目标检测(以下指general object detection)的任务是在场景中检测出给定的一组类别中所有的物体,这个类别组通常包含很多的类别,例如20类,为的是体现出检测任务的普适性(general)。检测分为两步,第一是对物体的位置(location)以...
2019-03-24 15:08:51
1219
1
原创 SVM研究(0)
最近一直在看SVM的一些论文,想做一下总结,因为发现以前看过的有关SVM的博客大多数都没有说的很清楚(反正我是还有细节没有搞懂),希望这篇文章能给一些人带来帮助,但主要是用来总结吧。 首先说SVM的来源。SVM是一个线性分类器,最开始的想法是要建立出一个比较稳定的线性分类器,由此便从几何上给出了一个使得间隔最大化的模型,当然,假设数据是线性可分的。 1. 我们先说说什么...
2018-07-16 18:40:03
501
原创 SVM研究(1)
上次说到如何推导出硬间隔的线性SVM,这次我们将它拓展一下,写成一个无约束问题,然后与logistic回归化为同一个形式。(1)软间隔SVM(1)这个式子是我们一般的SVM问题(硬间隔),在添加松弛约束的变量后,可以被转化为软间隔的SVM:...
2018-07-16 18:39:39
433
原创 SVM研究(2)
上回介绍了软间隔的SVM,但是还都是局限于原问题(primal problem)的形式,有一些算法是针对对偶问题(dual problem)提出的,所以这次就把对偶问题推导出来。我们对问题做一个简化,将替换为,对应的,每一个样本替换为增加一个维度,这样子就变为。事实表明,这的确是某些算法得以成立的重要步骤。(1)L1-SVM的对偶问题...
2018-07-16 18:39:25
876
翻译 显著度论文阅读(0)
这几个月一直在看显著度方面的论文,断断续续的,不成体系,一会儿看看生物方面的东西,一会儿又要看看图相处理方面的东西,什么方面都有涉及,挺杂的。最开始看得是11年的一篇,看的挺开心,因为讲得很简单的样子,之后又看了14年的一篇《Salient Object Detection: A Survey》,是一个综述,虽然内容也不难,但是总是也看不懂,拖了几个月了连这一篇都没看完,决定对这篇...
2018-04-22 11:27:04
588
COCO和Pascal VOC数据集可视化工具.rar
2019-07-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人