
Object Detection
文章平均质量分 81
mingo_敏
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
深度学习论文: YOLOMG: Vision-based Drone-to-Drone Detection with Appearance and Pixel-Level Motion Fusion
针对复杂环境下微型无人机检测难题,本文提出端到端框架YOLO-MG,通过运动引导实现精准检测。原创 2025-05-13 15:49:45 · 143 阅读 · 0 评论 -
YOLOE:Real-Time Seeing Anything 让 AI 像人类眼睛一样 “看见一切”!
比如训练时教它认“汽车”和“行人”,遇到没见过的“无人机”或“外星生物”就彻底懵圈。传统YOLO就像戴着一副“预设眼镜”,只能看到预先定义的物体。而。原创 2025-03-14 10:01:57 · 507 阅读 · 0 评论 -
深度学习论文: D-FINE: Redefine Regression Task of DETRs as Fine-grained Distribution Refinement
在实时目标检测领域发展日新月异的当下,D - FINE 以一种极具革新性的姿态横空出世。它犹如一把利刃,显著突破了现有模型的性能瓶颈,这些模型涵盖了如 YOLOv10、YOLO11 以及 RT - DETR v1/v2/v3 等业内知名的目标检测模型,大幅提升了实时目标检测的性能上限。D - FINE 在大规模数据集 Objects365 上完成预训练后,展现出了令人惊叹的实力。它将竞争对手 LW - DETR 远远甩在身后,在 COCO 数据集上更是斩获了高达 59.3% 的平均精度(AP)。原创 2025-02-25 13:49:07 · 188 阅读 · 0 评论 -
深度学习论文: YOLOv12: Attention-Centric Real-Time Object Detectors
在目标检测领域,YOLO 系列算法凭借在延迟与准确率间的出色平衡占据主导地位。尽管其改进涉及多个方面,但网络架构设计始终是研究的关键方向。近年来,以注意力为核心的视觉 Transformer(ViT)架构展现出强大建模能力,然而多数架构设计仍聚焦于卷积神经网络(CNN)。这是因为注意力机制存在效率问题,包括二次计算复杂性和低效的内存访问操作,这极大限制了其在对推理速度要求高的 YOLO 系统中的应用。原创 2025-02-20 10:57:44 · 295 阅读 · 0 评论 -
深度学习论文: RemDet: Rethinking Efficient Model Design for UAV Object Detection
无人机(UAV)图像中的目标检测正成为研究热点,但面临两大难题:目标小而密集,以及计算资源受限导致模型难以实时部署。当前实时检测器未针对无人机图像优化,且小物体检测方法往往缺乏实时性。为应对这些挑战,本文推出了RemDet(重参数高效乘法检测器)。识别挑战:本文深刻认识到小型密集无人机图像对检测器的挑战,提出将信息损失作为设计高效模型的关键考量。增强小目标检测:引入ChannelC2f模块,通过高维表示有效减轻信息丢失,提升小目标检测性能。原创 2024-12-26 09:43:46 · 746 阅读 · 0 评论 -
深度学习论文: DEIM: DETR with Improved Matching for Fast Convergence
目标检测在自动驾驶和机器人导航等领域至关重要,而YOLO因其速度快和准确性高而成为主流的实时检测工具。然而,YOLO的一对多锚点策略会导致多个重叠的边界框,需要非极大值抑制(NMS)来减少冗余,这增加了计算延迟和不稳定性。DETR模型通过一对一匹配策略避免了NMS,但它们的慢速收敛和低质量匹配限制了性能。为了解决这些问题,本文提出了一种新的密集一对一(Dense O2O)匹配策略,它通过增加训练图像中的目标数量来生成更多的正样本,从而提供与一对多策略相当的监督水平,而无需增加额外的计算负担。原创 2024-12-25 08:38:23 · 753 阅读 · 0 评论 -
深度学习论文: DSORT-MCU: Detecting Small Objects in Real-Time on Microcontroller Units
轻量级神经网络的显著进步已经极大地推动了计算机视觉技术在各类物联网(IoT)应用中的革新,这些应用广泛涉及远程监控和流程自动化等领域。然而,对于众多此类应用而言,小型物体的检测至关重要,但这一领域在计算机视觉研究中仍属未被充分探索的范畴,尤其是在资源受限的嵌入式设备上,这些设备通常配备有性能有限的处理器。为应对这一挑战,本文提出了一种创新的分块策略,旨在优化轻量级且节能的目标检测网络,其中包括YOLO基础模型及广受欢迎的“更快地找到更多物体”(FOMO)网络。原创 2024-11-29 15:39:53 · 130 阅读 · 0 评论 -
深度学习论文: SL-YOLO: A Stronger and Lighter Drone Target Detection Model
SLYOLO,一个基于YOLOv8s的轻量级模型,旨在提高复杂环境下小目标检测的性能,并适用于资源受限的设备。SLYOLO 提出了一个层次扩展路径聚合网络(HEPAN),它可以更好地融合不同层次的特征,从而提高模型捕获小目标的能力。此外设计了一个C2fDCB轻量级模块,通过优化网络的卷积结构,减少模型参数数量和计算复杂性。针对YOLOv8在无人机图像中小目标检测的不足,增加了专门用于小目标的检测层,有效提升了模型对小目标的捕获能力。原创 2024-11-29 10:42:20 · 443 阅读 · 0 评论 -
Bounding Box Regression Loss演变过程
目标检测任务的损失函数由Classificition Loss和Bounding Box Regeression Loss两部分构成。本文介绍目标检测任务中近几年来Bounding Box Regression Loss Function的演变过程原创 2024-10-16 13:40:38 · 160 阅读 · 0 评论 -
深度学习论文: PointOBB-v2: Towards Simpler, Faster, and Stronger Single Point Supervised OBB
深度学习论文: PointOBB-v2: Towards Simpler, Faster, and Stronger Single Point Supervised Oriented Object DetectionPointOBB-v2: Towards Simpler, Faster, and Stronger Single Point Supervised Oriented Object DetectionPDF: https://arxiv.org/pdf/2410.08210PyTorch代原创 2024-10-15 13:55:31 · 399 阅读 · 0 评论 -
深度学习论文: Slender Object Detection: Diagnoses and Improvements
本文关注细长物体的检测,这类物体具有极端的长宽比,在现实生活中十分常见,对检测系统的目标实现至关重要。然而,以往的目标检测算法在很大程度上忽略了这一类别。研究发现,在经典目标检测方法的评估中,若专注于细长物体,其在COCO数据集上的平均精度均值(mAP)会显著下滑18.9%。鉴于此,本文深入研究了细长物体检测的问题,构建了一个分析框架,并设计了专门的基准测试和评估流程,以便全面审视和对比不同的算法与模块。研究结果显示,有效的细长物体检测不依赖于基于锚点的定位方式或特定的框表示方法,而关键在于特征适应。原创 2024-10-11 16:57:10 · 370 阅读 · 0 评论 -
深度学习论文: YOLOv5, YOLOv8 and YOLOv10: The Go-To Detectors for Real-time Vision
本文全面回顾了 YOLO(You Only Look Once)目标检测算法的演进,重点关注了 YOLOv5、YOLOv8 和 YOLOv10。我们分析了这些版本在架构进步、性能提升以及边缘部署适用性方面的情况。YOLOv5 引入了 CSPDarknet 主干和马赛克增强等重大创新,平衡了速度和准确性。YOLOv8 在此基础上通过增强特征提取和无锚点检测,提高了通用性和性能。YOLOv10 通过无NMS训练、空间-通道解耦下采样和大核心卷积等特性,实现了跨越式进步,达到了最先进的性能,同时减少了计算开销。原创 2024-07-12 11:20:59 · 1864 阅读 · 0 评论 -
深度学习论文: YOLOv10: Real-Time End-to-End Object Detection
YOLO在实时物体检测领域因计算成本与检测性能的平衡而领先。尽管研究人员在架构、优化目标和数据增强方面取得显著进展,但YOLO对NMS的依赖影响了其端到端部署和推理速度。此外,YOLO组件设计的不足导致计算冗余和性能限制。为此,YOLOv10专注于后处理和模型架构,提出了无NMS训练的一致对偶分配方法,实现高性能和低延迟。同时,YOLOv10采用效率-准确度驱动的策略,全面优化YOLO组件,降低计算成本并提高性能。原创 2024-05-27 14:47:36 · 1151 阅读 · 2 评论 -
深度学习论文: YOLC: You Only Look Clusters for Tiny Object Detection in Aerial Images及其PyTorch实现
为了应对大规模图像和物体分布不均带来的挑战,提出的YOLC框架,建立在Anchor-Free点目标检测器CenterNet的基础之上。在YOLC中,局部尺度模块(LSM)发挥了关键作用,它能够自适应地搜索并放大聚类区域,从而显著提升检测精度。此外,还引入了高斯Wasserstein距离(GWD)来优化回归损失,确保生成的边界框质量更高。在检测Head部分,YOLC巧妙地结合了可变形卷积与细化方法,进一步增强了小物体的检测能力。这些创新举措共同使得YOLC在航拍图像的目标检测任务中表现出色。原创 2024-04-24 16:41:43 · 1703 阅读 · 2 评论 -
深度学习论文: GhostNetV3:Exploring the TrainingStrategies for Compact Models及其PyTorch实现
本文深入研究了多种训练策略,旨在提升现有紧凑型模型的性能。这些技术涵盖了重新参数化、知识蒸馏、数据增强以及学习计划调整等方面,而无需在推断阶段对模型架构进行任何修改。值得一提的是,本文训练的GhostNetV3模型在CPU和手机平台上均经过验证,成功实现了准确性与推断成本之间的最佳平衡。原创 2024-04-23 11:41:14 · 1303 阅读 · 0 评论 -
深度学习论文: YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information及其PyTorch实现
首先,YOLOv9引入了革命性的可编程梯度信息(Programmable Gradient Information, PGI)技术,这一创新理念致力于解决深层神经网络中信息丢失的难题。传统的目标检测网络在传递深层信息时,经常丢失对最终预测至关重要的细节。然而,YOLOv9借助PGI技术,确保了网络在学习过程中能够维持完整的输入信息,从而获取更加可靠和精确的梯度信息,极大地提升了权重更新的准确性。这一独特的设计显著提高了目标检测的准确率,为实现实时、高精度的目标检测提供了强有力的支持。原创 2024-03-01 17:25:35 · 902 阅读 · 0 评论 -
深度学习论文: Gold-YOLO: Efficient Object Detector via Gather-and-Distribute Mechanism及其PyTorch实现
在过去的几年中,YOLO系列模型已经成为实时目标检测领域的领先方法。许多研究通过修改架构、增加数据和设计新的损失函数,将基线推向了更高的水平。然而以前的模型仍然存在信息融合问题,尽管特征金字塔网络(FPN)和路径聚合网络(PANet)已经在一定程度上缓解了这个问题。因此,本研究提出了一种先进的聚集和分发机制(GD机制),该机制通过卷积和自注意力操作实现。这种新设计的模型被称为Gold-YOLO,它提升了多尺度特征融合能力,在所有模型尺度上实现了延迟和准确性的理想平衡。原创 2023-09-22 11:32:28 · 4115 阅读 · 0 评论 -
深度学习论文: PE-YOLO: Pyramid Enhancement Network for Dark Object Detection及其PyTorch实现
当前的目标检测模型在许多基准数据集上取得了良好的结果,但在暗条件下检测物体仍然是一个巨大的挑战。为了解决这个问题,我们提出了一个金字塔增强网络(PENet),并将其与YOLOv3结合起来构建一个名为PE-YOLO的暗物体检测框架。首先,PENet使用拉普拉斯金字塔将图像分解为四个不同分辨率的组件。具体来说,我们提出了一个细节处理模块(DPM)来增强图像的细节,它由上下文分支和边缘分支组成。此外,我们提出了一个低频增强滤波器(LEF)来捕捉低频语义并防止高频噪声。原创 2023-09-11 17:09:08 · 1143 阅读 · 3 评论 -
深度学习论文: YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection
基于一系列对不同Kernel-Size卷积如何影响不同尺度上目标检测性能的研究,提出一个名为YOLO-MS的网络架构。作者在MS COCO数据集上从头开始训练YOLO-MS,而不依赖于任何其他大规模数据集,如ImageNet,或预训练权重。YOLO-MS在使用相同数量的参数和FLOPs的情况下,优于最近的最先进的实时目标检测器,包括YOLO-v7和RTMDet。从局部视角来看,设计的一个具有简单而有效的分层特征融合策略的MS-Block。原创 2023-08-17 11:39:40 · 952 阅读 · 0 评论 -
深度学习论文: FemtoDet: An Object Detection Baseline for Energy Versus Performance Tradeoffs及其PyTorch实现
深度学习论文: FemtoDet: An Object Detection Baseline for Energy Versus Performance Tradeoffs及其PyTorch实现FemtoDet: An Object Detection Baseline for Energy Versus Performance TradeoffsPDF: https://arxiv.org/pdf/2301.06719.pdfPyTorch代码: https://github.com/shangli原创 2023-07-21 09:54:17 · 604 阅读 · 0 评论 -
YOLOv5 vs YOLOv8
YOLOv5 N/S/M/L/X 骨干网络的通道数设置使用同一套缩放系数;YOLOv8 N/S/M/L/X 骨干网络的通道数设置不一样,使用不同的缩放系数。YOLOv7 网络设计也采用类似的方式作用于所有模型。原创 2023-06-20 12:00:13 · 9737 阅读 · 2 评论 -
深度学习论文: Task-Specific Context Decoupling for Object Detection及其PyTorch实现
目标检测还需要定位出图像中每个感兴趣目标所在的位置和类别信息,但是定位和分类两个子任务对特征上下文的偏好并不一致,其中,定位需要更多的边界感知特征来准确地回归边界框,而分类任务则需要更多的语义上下文信息。两者之间存在一种空间不对齐(spatial misalignment)的问题。通过实验,作者提出全连接头可能更适合分类任务,而卷积头则更适合定位任务,这是因为fc-head比conv-head具备更高的空间敏感性,具有更强的区分完整对象和部分对象的能力,但对于回归整个对象并不稳健。原创 2023-03-14 15:52:19 · 2399 阅读 · 2 评论 -
深度学习论文: EdgeYOLO: An Edge-Real-Time Object Detector及其PyTorch实现
EdgeYOLO是一种具有良好精度并且能够在边缘设备上实时运行的目标检测器。设计了一种Anchor-Free目标检测器,该检测器可以在MS COCO2017数据集中实时运行在边缘设备上,准确率为50.6%AP;提出了一种更强大的数据增强方法,进一步确保了训练数据的数量和有效性;模型中使用了可重参化的结构,以减少推理时间;设计了一个损失函数,以提高小目标的精度。原创 2023-02-23 14:37:04 · 1694 阅读 · 1 评论 -
深度学习论文: YOLOv6 v3.0: A Full-Scale Reloading及其PyTorch实现
通过扩展的骨干网络(Backbone)和颈部(Head)设计,YOLOv6 3.0 最终实时实现了 YOLO 家族的 SOTA。原创 2023-02-01 15:26:52 · 1074 阅读 · 2 评论 -
深度学习论文: YOLOX-PAI: An Improved YOLOX, Stronger and Faster than YOLOv6及其PyTorch实现
针对YOLOX,加入诸多改进技巧的复现和探索,进一步提升了YOLOX的性能,在速度和精度上都比现阶段的40~50mAP 的SOTA的YOLOv6更胜一筹。原创 2022-09-23 10:38:09 · 514 阅读 · 0 评论 -
深度学习论文: YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications及其PyTorch实现
YOLOv6 支持检测模型训练、评估、预测以及模型量化、蒸馏等全链路开发流程,同时支持 GPU(TensorRT)、CPU(OPENVINO)、ARM(MNN、TNN、NCNN)等不同平台的部署,极大简化工程部署时的适配工作。原创 2022-09-21 20:06:01 · 1498 阅读 · 1 评论 -
深度学习论文: ObjectBox: From Centers to Boxes for Anchor-Free Object Detection及其PyTorch实现
ObjectBox仅使用目标中心位置作为正样本,并在不同的特征级别平等对待所有目标,而不管物体的大小或形状。将新的回归目标定义为从中心单元位置的2个角到边界框4个边的距离提出了一种定制的 IoU 损失来处理不同大小尺度变化的框。...原创 2022-08-02 19:07:13 · 812 阅读 · 3 评论 -
深度学习论文: YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for object detectors及其PyTorch实现
深度学习论文: YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors及其PyTorch实现YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectorsPDF: https://arxiv.org/pdf/2207.02696.pdfPyTorch代码: ht原创 2022-07-09 18:39:55 · 1489 阅读 · 0 评论 -
深度学习论文: CDNet: a real-time and robust crosswalk detection network on Jetson nano based on YOLOv5
深度学习论文: CDNet: a real-time and robust crosswalk detection network on Jetson nano based on YOLOv5CDNet: a real-time and robust crosswalk detection network on Jetson nano based on YOLOv5PDF: https://rdcu.be/cHuc8PyTorch代码: https://github.com/shanglianlm05原创 2022-03-14 08:51:54 · 1836 阅读 · 2 评论 -
深度学习论文: SFPN: Synthetic FPN for Object Detection及其PyTorch实现
深度学习论文: SFPN: Synthetic FPN for Object Detection及其PyTorch实现SFPN: Synthetic FPN for Object DetectionPDF: https://arxiv.org/pdf/2203.02445.pdfPyTorch代码: https://github.com/shanglianlm0525/CvPytorchPyTorch代码: https://github.com/shanglianlm0525/PyTorch-Net原创 2022-03-09 07:50:56 · 6630 阅读 · 5 评论 -
深度学习论文: Slicing Aided Hyper Inference and Fine-tuning for Small Object Detection及其PyTorch实现
深度学习论文: Slicing Aided Hyper Inference and Fine-tuning for Small Object Detection及其PyTorch实现Slicing Aided Hyper Inference and Fine-tuning for Small Object DetectionPDF: https://arxiv.org/pdf/2202.06934.pdfPyTorch代码: https://github.com/shanglianlm0525/CvP原创 2022-03-08 19:23:55 · 5278 阅读 · 6 评论 -
深度学习论文: GiraffeDet: A Heavy-Neck Paradigm for Object Detection及其PyTorch实现
深度学习论文: GiraffeDet: A Heavy-Neck Paradigm for Object Detection及其PyTorch实现GiraffeDet: A Heavy-Neck Paradigm for Object DetectionPDF: https://arxiv.org/pdf/2202.04256.pdfPyTorch代码: https://github.com/shanglianlm0525/CvPytorchPyTorch代码: https://github.com原创 2022-02-16 10:49:03 · 1717 阅读 · 2 评论 -
深度学习论文: Improved YOLOv5 network for real-time multi-scale trafficsign detection及其PyTorch实现
深度学习论文: Improved YOLOv5 network for real-time multi-scale trafficsign detection及其PyTorch实现Improved YOLOv5 network for real-time multi-scale trafficsign detectionPDF: https://arxiv.org/ftp/arxiv/papers/2112/2112.08782.pdfPyTorch代码: https://github.com/sha原创 2022-01-04 15:30:05 · 5954 阅读 · 4 评论 -
深度学习论文: YOLO-Z: Improving small object detection in YOLOv5 for autonomous vehicles及其PyTorch实现
深度学习论文: YOLO-Z: Improving small object detection in YOLOv5 for autonomous vehicles及其PyTorch实现YOLO-Z: Improving small object detection in YOLOv5 for autonomous vehiclesPDF: https://arxiv.org/pdf/2112.11798.pdfPyTorch代码: https://github.com/shanglianlm0525原创 2022-01-04 14:17:11 · 5863 阅读 · 7 评论 -
深度学习论文: Image-Adaptive YOLO for Object Detection in Adverse Weather Conditions及其PyTorch实现
深度学习论文: Image-Adaptive YOLO for Object Detection in Adverse Weather Conditions及其PyTorch实现Image-Adaptive YOLO for Object Detection in Adverse Weather ConditionsPDF: https://arxiv.org/pdf/2112.08088.pdfPyTorch代码: https://github.com/shanglianlm0525/CvPytor原创 2021-12-18 14:18:39 · 7945 阅读 · 40 评论 -
深度学习论文: Remote Sensing Image Object Detection Based on Angle Classification
深度学习论文: Remote Sensing Image Object Detection Based on Angle Classification及其PyTorch实现Remote Sensing Image Object Detection Based on Angle ClassificationPDF: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9521517PyTorch代码: https://github.c原创 2021-11-10 13:35:49 · 2535 阅读 · 1 评论 -
深度学习论文: YOLO-ReT: Towards High Accuracy Real-time Object Detection on Edge GPUs及其PyTorch实现
深度学习论文: YOLO-ReT: Towards High Accuracy Real-time Object Detection on Edge GPUs及其PyTorch实现YOLO-ReT: Towards High Accuracy Real-time Object Detection on Edge GPUsPDF: https://arxiv.org/pdf/2110.13713.pdfPyTorch代码: https://github.com/shanglianlm0525/CvPyt原创 2021-11-08 14:31:45 · 517 阅读 · 0 评论 -
yolov5修改non_max_suppression支持多个置信度过滤
如题原始的non_max_suppressiondef non_max_suppression(prediction, conf_thres=0.25, iou_thres=0.45, classes=None, agnostic=False, multi_label=False, labels=()): """Runs Non-Maximum Suppression (NMS) on inference results Returns:原创 2021-10-29 14:54:15 · 4006 阅读 · 7 评论 -
深度学习论文: TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head 及其PyTorch实现
深度学习论文: TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Drone-captured Scenarios及其PyTorch实现TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Drone-captured ScenariosPDF: http原创 2021-09-14 10:29:04 · 4688 阅读 · 0 评论 -
深度学习论文: You Only Look at Once for Panoptic driving Perception及其PyTorch实现
深度学习论文: You Only Look at Once for Panoptic driving Perception及其PyTorch实现You Only Look at Once for Panoptic driving PerceptionPDF: https://arxiv.org/pdf/2108.11250.pdf1 概述2 Architecture2-1 EncoderBackbone:Neck:2-2 DecodersDetect HeadDrivable Are原创 2021-09-02 14:59:03 · 455 阅读 · 0 评论