2D目标检测论文笔记
文章平均质量分 91
2D目标检测论文笔记
Tianchao龙虾
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Cascade R-CNN: Delving into High Quality Object Detection 论文笔记
Cascade R-CNN: Delving into High Quality Object DetectionCascade R-CNN CVPR2018论文链接: https://arxiv.org/abs/1712.00726一、 Problem Statement在目标检测中,通常使用IoU的值来确定正负样本,如果使用低的IoU值,会产生noisy detection,如果使用高的IoU值,会有两个问题:在训练的时候会过拟合,因为正样本的数量指数级减少。推理的时候与训练的时候不匹配。原创 2021-11-08 15:23:03 · 280 阅读 · 0 评论 -
ThunderNet 论文笔记
ThunderNet: Towards Real-time Generic Object Detection ThunderNet 论文链接: https://arxiv.org/abs/1903.11752一、 Problem Statement作者设计一个在计算资源有限的情况下,能达到实时的检测器。目前的detectors分为两类:two-stage detectorsone-stage detectorstwo-stage检测器如Light-Head R-CNN,有一个缺点就是w原创 2021-11-02 14:06:21 · 318 阅读 · 0 评论 -
Rethinking Classification and Localization for Object Detection 论文笔记
Rethinking Classification and Localization for Object Detection CVPR 2020 论文链接: https://arxiv.org/abs/1904.06493一、 Problem StatementR-CNN based的检测器通常都是有两个检测头,classification head和localization head。但是很少研究去理解这两个检测头是怎么工作的。二、 Direction通过不同的全连接层和卷积层的组合,探索不原创 2021-10-25 15:09:54 · 557 阅读 · 0 评论 -
YOLOP 论文笔记
YOLOP: You Only Look Once for Panoptic Driving Perception YOLOP 论文链接: https://arxiv.org/abs/2108.11250v5一、 Problem Statement自动驾驶中,如果使用一个接一个模型来进行图像分析,比如目标检测,语义分割和车道线检测,会增大消耗资源,也有可能无法达到实时性能。二、 Direction提出一个通用范式: one encoder backbone + three prediction原创 2021-10-18 10:30:58 · 906 阅读 · 0 评论 -
YOLOX 论文笔记
YOLOX: Exceeding YOLO Series in 2021 YOLOX 论文链接: https://arxiv.org/abs/2107.08430一、 Problem Statement提出一些tricks,用于提升YOLO系列。二、 DirectionA decoupled headStrong augmentationAnchor-freeMulti positivesLabel assignment strategy: SimOTA三、 Method作者选原创 2021-10-12 13:44:48 · 537 阅读 · 0 评论 -
You Only Look One-level Feature 论文笔记
You Only Look One-level Feature YOLOF CVPR2021论文链接: https://arxiv.org/abs/2103.09460一、 Problem Statement作者认为FPN网络的成功来自于两个方面: multi-scale feature fusion和 divide-and-conquer的方法。前者可以融合低分辨率和高分辨率的特征图来获得更好地表征;后者可以在不同层级上检测目标。现在大部分研究都是关于前者,后者被忽略了。但是作者实验表面: FP原创 2021-09-29 09:36:44 · 255 阅读 · 0 评论 -
FCOS 论文笔记
FCOS: Fully Convolutional One-Stage Object Detection论文链接: https://arxiv.org/abs/1904.01355一、 Problem Statement目前的目标检测网络大多数依赖于anchor。而anchor存在着以下几个缺点的:检测性能对anchor参数的设置很敏感,需要很仔细的优化。anchor的大小和比例都是固定的,对于形状变化大的目标,特别是小目标,检测网络比较难处理。为了获得hight-recall rate, 往原创 2021-09-08 22:35:30 · 524 阅读 · 0 评论 -
CornerNet-Lite: Efficient Keypoint-Based Object Detection 论文笔记
CornerNet-Lite: Efficient Keypoint-Based Object Detection论文链接: https://arxiv.org/abs/1904.08900一、 Problem StatementCornerNet的推理速度太慢,提升CornerNet效率。二、 Directionreducing the number of pixels processed --减少处理的像素数量reducing the amount of processing per p原创 2021-06-19 16:08:30 · 267 阅读 · 0 评论 -
CornerNet: Detecting Objects as Paired Keypoints 论文笔记
CornerNet: Detecting Objects as Paired Keypoints论文链接: https://arxiv.org/abs/1808.01244一、 Problem StatementAnchor boxes 有两个缺点:positive 和 negative anchors数量的不平衡,训练慢。引入了超参数,比如大小,比例,数量等等。二、 DirectionAnchor-free的方法,检测bounding box的左上角和右下角的点,引入了Corner-po原创 2021-06-17 14:34:37 · 286 阅读 · 1 评论 -
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 论文笔记
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows论文链接: https://arxiv.org/abs/2103.14030一、 Problem Statement目前在vision task上使用transformer有两个挑战:scale difference。 在目前的transformer-based的方法中,tokens通常都是固定大小,对于vision task不适用,因为视觉的元素可以在尺度原创 2021-06-10 10:09:07 · 365 阅读 · 0 评论 -
YOLO 9000: Better, Faster, Stronger 论文笔记
YOLO 9000: Better, Faster, Stronger论文链接: https://arxiv.org/abs/1612.08242一、Problem Statement作者改进了YOLOv1以及提出了目标分类与检测联合训练的方法,通过这种方法,YOLO9000可以同时在COCO和ImageNet数据集中进行训练,训练后的模型可以实现多达9000种物体的实时检测。二、DirectionBetter, Faster: YOLOv2Stronger: YOLO9000作者认为YOLO原创 2021-05-08 08:40:57 · 286 阅读 · 0 评论 -
YOLOv3: An Incremental Improvement 论文笔记
YOLOv3: An Incremental Improvement论文链接: https://arxiv.org/abs/1804.02767一、Problem StatementJust a bunch of small changes that make it better。二、Direction作者优化的方向:Bounding Box PredictionClass PredictionPredictions Across ScalesFeature Extractor三、M原创 2021-05-08 08:37:16 · 570 阅读 · 0 评论 -
YOLOv4: Optimal Speed and Accuracy of Object Detection 论文笔记
YOLOv4: Optimal Speed and Accuracy of Object Detection论文链接: https://arxiv.org/abs/2004.10934一、Problem Statement作者使用一些tricks提升检测效果,包括: Weighted-Residual-Connections(WRC), Cross-Stage-Partial-connections(CSP), Cross mini-Batch Normalization(CmBN), self-ad原创 2021-05-08 08:32:56 · 398 阅读 · 0 评论 -
SSD: Single Shot MultiBox Detector论文笔记
SSD: Single Shot MultiBox Detector论文链接: https://arxiv.org/abs/1512.02325一、Problem Statement作者认为目前的检测系统都是以下方法的变体:假设bounding box,对每个框重新取样像素或特征,再应用高质量分类器。这些方法对于嵌入式系统来说计算量过大,即使对于高端硬件,对于实时或接近实时的应用来说也太慢。本文提出了第一个基于深层网络的对象检测器,它不会对bounding box假设的像素或特征进行重新取样,但和上面原创 2021-05-08 08:25:07 · 301 阅读 · 0 评论 -
Scaled-YOLOv4: Scaling Cross Stage Partial Network 论文笔记
Scaled-YOLOv4: Scaling Cross Stage Partial Network论文链接: https://arxiv.org/abs/2011.08036一、Problem StatementCSPNet的作者用其CSPNet的方法分别从网络的深度,宽度,结构和输入图像的分辨率改善YOLOV4。二、Direction作者发现在RegNet中,CNN最优的深度为60左右,且当bottleneck的比例设置为1,和cross-stage的宽度增长比例设置为2.5时,能获得最好的性原创 2021-05-08 08:16:31 · 655 阅读 · 0 评论 -
Feature Pyramid Network for Object Detection 论文笔记
Feature Pyramid Network for Object Detection论文链接: https://arxiv.org/abs/1612.03144一、Problem Statement特征金字塔在识别系统中是一个基本的组成部分,用于在不同尺度上检测目标。但是因为传统的特征金字塔计算和存储花费太大,作者就提出以一个较小的额外花费来构建一个特征金字塔。它是一个为了在所有尺度上建立高层次语义特征映射的一个自顶向下且含有旁支的结构。(a)使用image pyramid,特征是通过不同图原创 2021-05-01 11:05:19 · 297 阅读 · 0 评论 -
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 论文笔记
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文链接: https://arxiv.org/abs/1506.01497一、Problem Statement像SPPnet, Fast R-CNN这些网络中,使用selective search的方法提取region proposal, 暴露出region proposal 的计算是个瓶颈。二、Direction提出了一个Region原创 2021-04-30 08:24:37 · 229 阅读 · 0 评论 -
Objects as Points 论文笔记
Objects as Points论文链接: https://arxiv.org/abs/1904.07850一、Problem Statement作者认为把大量的候选框进行后处理时浪费,低效的。因此提出把目标当作一个bounding box的中心点。因此这个模型使用关键点检测去找中心点,然后回归目标的其他性质,如大小,3D位置,方向,甚至姿态。One stage检测器: 在图像上设置anchors,然后对这些anchors直接分类,没有指定框中的内容。Two stage检测器: 对每个propo原创 2021-04-27 08:43:43 · 246 阅读 · 0 评论 -
YOLOv5 解析
YOLOv5项目链接: https://github.com/ultralytics/yolov5Problem StatementYOLOv5 分析。 皆为[1] 中的内容。摘抄作为记录。原博客地址。侵权请联系删除。Direction先来看一下网络结构:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PMKgciku-1619049923731)(image1.png)]整体的大结构没有改变。1. 输入端:Mosaic数据增强、自适应锚框计算2. Ba转载 2021-04-22 08:08:46 · 19389 阅读 · 5 评论
分享