
论文阅读笔记
文章平均质量分 90
今天学习了嗷
今天不学习,明天变LaJi。
展开
-
浅读一下美团提出的YOLOV6
浅读一下美团视觉智能部提出的YOLOV6:专用于工业应用的单阶段目标检测框架原创 2022-06-29 21:21:13 · 4670 阅读 · 3 评论 -
DENSE POINT PREDICTION: A SIMPLE BASELINE FOR CROWD COUNTING AND LOCALIZATION(论文阅读笔记)
DENSE POINT PREDICTION: A SIMPLE BASELINE FOR CROWD COUNTING AND LOCALIZATION (论文阅读笔记)文章出处:IEEE ICME Workshop,2021摘要在这篇文章中,作者提出了一个简单但是有效的人群计数和定位网络——SCALNet,与现有的将计数和定位任务分离的工作不同,作者将这些任务视为像素级密集预测问题,并将其集成到一个端到端框架中。具体来说,对于人群计数,采用了由均方误差(MSE)损失监督的计数头。对于人群定位,关原创 2022-05-06 21:02:20 · 859 阅读 · 1 评论 -
Density Map Guided Object Detection in Aerial Images (论文阅读笔记)
Density Map Guided Object Detection in Aerial Images 论文阅读笔记出处:CVPR2020一、介绍文章主要研究的是基于高分辨率航拍图像的目标检测,其难点有二:1)目标尺度变化较大; 2) 目标的数量和类别分布不均匀;3)目标遮挡和截断;4)小目标占比多。比较通用的方法是将图像进行规则的裁剪,然后对每一块裁剪区域分别进行目标检测。这种方法能够提高小目标的检测精度,因为当小物体的大小被调整到原始图像的大小时,它们的分辨率会变得更高。然而这些方法并不能平原创 2021-12-30 22:00:25 · 2659 阅读 · 1 评论 -
目标计数方法概述
目标计数方法概述1、如何进行目标计数?目标计数的方法主要有三类。基于检测的方法。使用传统的基于 HOG 的检测器或基于深度学习的检测器,如 YOLO 或 RCNN。但这类方法的效果在目标场景中容易受到遮挡的严重影响。基于回归的方法。这类方法只是从原始图像中捕获一些特征,并使用机器学习模型来映射特征和数字之间的关系。在深度学习之前,基于回归的方法是 SOTA,研究人员专注于寻找更有效的特征来估计更准确的结果。但是,当深度学习变得流行并取得更好的结果时,基于回归的方法就会受到较少的关注,因为很难捕捉到原创 2021-12-28 16:10:42 · 4014 阅读 · 0 评论 -
Small Object Detection using Context and Attention(论文阅读笔记)
Small Object Detection using Context and Attention 论文阅读笔记出处:2021 International Conference on Artificial Intelligence in Information and Communication (ICAIIC) Jeju Island, Korea一、介绍目标检测算法在各种环境下的应用存在许多局限性,特别是检测小物体仍然具有挑战性,因为它们的分辨率低,信息有限。文章提出了一种使用上下文的目原创 2021-12-23 15:10:05 · 2974 阅读 · 4 评论 -
Learning To Count Everything(论文阅读笔记)
Learning To Count Everything论文地址:https://arxiv.org/abs/2104.08391源码:https://github.com/cvlab-stonybrook/LearningToCountEverything出处:CVPR 2021作者单位:石溪大学, VinAI研究院一、摘要目前的计数工作主要集中于某种特定的类别,例如人、动物或者细胞。在这篇文章中,作者将计数任务当做一个少样本(few-shot)回归任务,通过少数带注释的实例来计数一切。作原创 2021-12-08 15:16:25 · 6708 阅读 · 1 评论 -
ByteTrack: Multi-Object Tracking by Associating Every Detection Box (论文阅读笔记)
ByteTrack: Multi-Object Tracking by Associating Every Detection Box摘要多目标跟踪(MOT)的目的是估计视频中物体的bounding box和Id。目前大多数的方法是通过关联得分高于阈值的检测框来获得Id。检测分数低的对象,例如被遮挡的物体,被简单地扔掉,这带来了不可忽略的真实物体丢失和碎片轨迹。为了解决这一问题,文章提出了一种简单、有效和通用的关联方法(ByteTrack):通过关联每个检测框而不是只关联得分高的检测框进行跟踪。对原创 2021-12-01 15:31:48 · 1630 阅读 · 0 评论 -
Alpha-IoU: A Family of Power Intersection over Union Losses for Bounding Box Regression (论文阅读笔记)
摘要Bounding box(bbox)回归是CV中的一项基本任务,最常用的损失函数是IOU Loss 和相关变体。文章将现有的基于IoU Loss推广到一个新的Power IoU系列 Loss,它具有一个幂次IoU项和一个附加的幂次正则项。这种新的损失系列为α-IoU Loss。在多个目标检测基准和模型上的实验表明,α- iou损失可以显著的超过现有的基于iou的损失;通过调节α,使探测器更灵活地实现不同水平的bbox回归精度;对小数据集和噪声的鲁棒性更强。一、介绍目标检测通常包含分类.原创 2021-11-24 20:36:00 · 5925 阅读 · 5 评论 -
Bag of Freebies for Training Object Detection Neural Networks 论文阅读笔记
Bag of Freebies for Training Object Detection Neural Networks 论文阅读笔记这个题目取的有点意思:用于训练目标检测神经网络的免费赠品袋摘要启发式训练大大提高了各种图像分类模型的准确率,而目标检测模型具有更为复杂的神经网络结构和优化目标。训练策略和管道在不同的模式中有很大的差异。在这个工作中,作者探索了适用于各种模型的训练调整,包括Faster R-CNN和YOLOv3。这些调整不会改变模型架构,因此,推理成本保持不变。然而,经验结果表明,原创 2021-11-10 22:26:53 · 2542 阅读 · 0 评论 -
YOLOX: Exceeding YOLO Series in 2021 论文阅读笔记
YOLOX: Exceeding YOLO Series in 2021这是一篇由旷视科技提出的2021超越YOLO系列的论文:YOLOX出处:CVPR 2021摘要文章介绍了 YOLO 系列的一些经验改进,形成了一个新的高性能探测器——YOLOX:anchor-free(无anchor)decoupled head(解耦头)label assignment strategy SimOTA(标签分配策略,基于作者的另一篇论文:Zheng Ge, Songtao Liu, Zeming Li原创 2021-11-10 17:49:38 · 4932 阅读 · 2 评论 -
SiamMOT: Siamese Multi-Object Tracking(论文阅读笔记)
出处:CVPR2021.5.25单位:亚马逊一、介绍多目标跟踪是检测目标实例,然后将它们临时关联起来形成轨迹的问题。文章的工作主要是改善在线多目标跟踪(MOT)。具体来说,作者引入一个基于 region 的 Siamese Multi-Object Tracking 网络:SiamMOT,包括一个运动模型,该模型估计实例在两帧之间的运动。通过所提出的 Siamese 跟踪器的两个变体来探索运动建模是如何影响其跟踪能力的,其中一个是隐式运动模型,一个是显式运动模型。作者在 MOT17、TAO-per.原创 2021-09-29 16:22:51 · 1828 阅读 · 0 评论 -
Multiple Object Tracking for Similar, Monotonic Targets (论文阅读笔记)
Multiple Object Tracking for Similar, Monotonic Targets (相似,单调目标的多目标跟踪)出处:摘要文章针对结构简单、特征单调、甚至没有明显学习特征的微观非荧光标记目标,提出了一种基于两步检测的多目标跟踪算法。具体操作为:首先对视频中的每个图像进行阈值分割,从背景中提取目标,并对得到的图象进行形态学运算,分离轻微粘附的目标,避免错误跟踪,然后利用卡尔曼滤波估计目标状态,并使用匈牙利算法进行数据关联,最终达到多目标跟踪的目的。本文研究的对象是假定原创 2021-09-25 19:49:24 · 181 阅读 · 0 评论 -
Robust High-Resolution Video Matting with Temporal Guidance 论文阅读笔记
Robust High-Resolution Video Matting with Temporal Guidance 论文阅读笔记基于时间制导的鲁棒高分辨率视频漫游简单来说:就是视频前景与背景分离摘要文章介绍了一个鲁棒性强、轻量、实时、高分辨率的人类视频匹配方法,并且达到了SOTA;处理速度:4K at 76 FPS and HD at 104 FPS on an Nvidia GTX 1080Ti GPU;与传统的将帧与帧作为独立图像抠图的方法不同,文章提出了一种循环结构来利用视频中原创 2021-09-07 10:26:02 · 2736 阅读 · 7 评论 -
Learning from Synthetic Data for Crowd Counting in the Wild 论文阅读笔记
Learning from Synthetic Data for Crowd Counting in the Wild 论文阅读笔记发表:CVPR 2019一、介绍人群计数任务很大一个问题是数据集过少。很多方法都或多或少的过拟合了。这篇论文提出了一个数据收集器和标注器,能够基于GTA5生成人工合成的人群场景,并同时自动标注它们。基于此构建了一个大规模的,各种各样的人工合成数据集。其次,提出了两个利用合成数据集提升现实人群计数性能的方法:1) 在合成数据集预训练,在现实数据集调优,显著的提升了模型的现原创 2021-07-28 13:27:10 · 669 阅读 · 0 评论 -
基于图像的人群计数研究(论文阅读笔记)
基于图像的人群计数研究(论文阅读笔记)一、人群计数研究的问题人群计数旨在估计图像或视频中人群的数量、密度或分布,属于目标计数领域中的一类,既是智能视频监控分析领域的关键问题和研究热点,也是后续行为分析、拥塞分析、异常检测和事件检测等高级视频处理任务的基础。二、人群计数研究的发展1 传统的通过传统的计算机视觉方法提取行人特征,然后通过目标检测或回归的方式获取图像或视频中人群的数量。无法从图像中提取更抽象的有助于完成人群计数任务的语义特征,使得面对背景复杂、人群密集、遮挡严重的场景时,计数精度无法满足原创 2021-07-27 18:21:10 · 6381 阅读 · 3 评论 -
SIMPLE ONLINE AND REALTIME TRACKING WITH A DEEP ASSOCIATION METRIC(DeepSort)论文阅读笔记
一、摘要SORT是一个简单有效的算法,用于多目标跟踪。这篇文章,我们加入了外观信息来提升SORT的性能。由于此扩展,即使长时间的遮挡我们也能够对物体进行跟踪,并且有效的减少ID跳变。并引入了在行人重识别数据集上离线训练的深度学习模型,在实时目标追踪过程中,提取目标的表观特征进行最近邻匹配。实验评价表明,我们的扩展对ID跳变的数量减少了45%,在高帧率下实现了整体竞争....原创 2021-07-07 19:58:52 · 337 阅读 · 1 评论 -
SIMPLE ONLINE AND REALTIME TRACKING(Sort) 论文阅读笔记
本文提出了一种实用的多目标跟踪方法,其主要关注点是为在线和实时应用程序有效地关联对象。为此,检测质量被认为是影响跟踪性能的关键因素,改变检测器可以提高跟踪性能,最高可达18.9%。尽管将大家熟悉的卡尔曼滤波和匈牙利算法的基本组合跟踪组件,该方法实现了与现有最先进跟踪技术相当的精度。但是,由于我们跟踪方法的简化,跟踪器能以260Hz的速率做更新,比其他先进跟踪器快了20倍。计算机视觉、多目标跟踪、检测、数据关联针对**多目标跟踪(MOT)**问题,本文提出了一种检测跟踪框架,其中目标检测每帧并表示为边界框。.原创 2021-07-06 12:05:53 · 451 阅读 · 1 评论 -
Yolov1-pytorch版 论文、原理及代码实现
YOLOv1-pytorch版 论文、原理及代码实现Yolov1 论文、原理、代码实现1、论文:[https://arxiv.org/pdf/1506.02640.pdf](https://arxiv.org/pdf/1506.02640.pdf)2、原理2.1 目标检测方法2.2 相关名词解释2.3 网络结构设计分析2.4 损失函数3 、PASCAL VOS 2007 和2012数据集4、代码实现4.1 数据预处理4.2 Dateset类构造4.3 网络实现4.4 开始训练4.5 预测4.6 实验结果参考原创 2021-04-26 09:35:52 · 17464 阅读 · 34 评论 -
CornerNet-Lite论文笔记与代码复现
CornerNet-Lite论文阅读与代码复现(一)Title(二)背景知识:Conernet1、Idea当今的目标检测算法大多都是基于深度学习模型的,大致可以分为两大门派,一个叫做One-Stage系列,另一个叫做Two-Stage系列。Two-Stage系列顾名思义就是两步走:是先由算法生成一系列作为样本的候选框(Region Proposal),再通过卷积神经网络对候选框进行分类回归,典型代表有R-CNN系列;而One-Stage系列则不用产生候选框,直接将目标边框定位的问题转化为回归问题处原创 2021-06-15 23:59:08 · 1318 阅读 · 4 评论 -
Weakly-Supervised Crowd Counting Learns from Sorting rather than Locations 论文阅读笔记
弱监督人群计数:基于排序而非位置信息作者:中国科学院大学中国科学院大数据挖掘与知识管理重点实验室中国科学院智能信息处理重点实验室意大利-特兰托大学1、摘要在人群计数数据集中,位置标签是昂贵的,但它们没有被纳入评价指标。此外,现有的多任务方法采用高级任务来提高计算精度。这种研究趋势增加了对注释的需求。本文提出了一种弱监督 计数网络,在没有位置监督的情况下直接回归人群数量。此外,我们通过利用图像之间的关系来训练网络的计数能力。我们在计数网络中也提出了一种软标签分类网络,该网络根据人群数量对给定图原创 2021-06-30 10:50:59 · 686 阅读 · 1 评论