
目标检测
文章平均质量分 92
卧式纯绿
电专读研ing
展开
-
每日文献(十四)——Part one
近年来,基于深度卷积神经网络的目标检测方法[1]、[2]、[3]在计算机视觉领域取得了重大进展。然而,卓越的性能在很大程度上依赖于丰富的注释图像的可用性。通常,获得足够的标记数据是劳动密集型的,并且可用训练样本的数量有限严重限制了当前视觉系统[4],[5],[6]的应用。为了克服这一障碍,研究人员开创了少量样本学习[7],[8],[9]的进步,它显示了用有限的标记数据泛化到新类别的能力。原创 2025-04-18 16:03:50 · 985 阅读 · 0 评论 -
每日文献(十三)——Part two
在本文中,我们引入了一种名为RefineNet的新策略来提高车辆检测的定位精度,并在AUC下获得了高达6%的增益。我们的方法依赖于使用已经计算的特征,使检测器非常快。具体来说,RefineNet在每张图像上运行大约0.22秒。在KITTI目标检测基准测试中,在中等难度设置下达到79.19%。它是最快的检测器,达到70%以上的AUC。在简单的难度设置下,它达到了90%的AUC,接近最先进的结果。结果表明,采用ZF结构,该方法大大提高了检测性能。使用更深层的网络(如VGG)来提高性能,将在未来进行研究。原创 2025-04-16 14:45:22 · 754 阅读 · 0 评论 -
每日文献(十三)——Part one
在为智能车辆和机器人开发基于视觉的系统时,精确的目标定位是一个重要的挑战。自动驾驶的基本组件,如环绕物体的精确3D定位、环绕代理行为分析、导航和规划,以及其他高级视觉任务[2],都受到初始物体定位质量的影响。本文研究了通过增加一个迭代改进目标盒建议的模块来改进深度卷积神经网络(CNN)目标检测器。所提出的细化模块重量轻,能够实现快速、高质量的目标检测。我们将这种新策略称为RefineNet,并分析了它的行为和收敛性。原创 2025-04-15 22:21:53 · 979 阅读 · 0 评论 -
每日文献(十二)——Part two
今天从第四节:结果开始介绍。原创 2025-04-14 10:06:06 · 1851 阅读 · 0 评论 -
每日文献(十二)——Part one
最近基于cnn的目标检测取得了显著的进展,提高了精度。更快的R-CNN具有集成的区域提议网络和端到端目标检测和区域提议网络的训练方案,为许多目标检测数据集设置了令人印象深刻的基线。为了寻求进一步的改进,社区主要选择了三种路径:1)深度网络:最值得注意的是,ResNet[13]使用使用残差学习训练的101层深度cnn从图像中学习更复杂的表示,2)多任务学习和多特征分类(图2):多任务学习是指使用不同的任务为目标检测提供额外的监督和正则化。这是通过训练网络来完成除了目标检测之外的辅助任务。原创 2025-04-13 18:55:19 · 900 阅读 · 0 评论 -
每日文献(十一)——Part two
今天从第四章:快速RCNN,方法细节开始介绍。原创 2025-04-12 16:18:06 · 739 阅读 · 0 评论 -
每日文献(十一)——Part one
目标检测的目标是学习汽车等概念的视觉模型,并使用该模型在图像中定位这些概念。这需要有能力对光照、变形、遮挡和其他类内变化进行稳健的不变性建模。处理这些不变性的标准范例是收集具有不同条件下目标实例的大规模数据集。例如,COCO数据集[18]有超过10K个不同遮挡和变形下的汽车样本。希望这些示例能够捕获视觉概念的所有可能变化,然后分类器可以有效地为它们建模不变性。我们相信这是卷积神经网络在目标检测任务上如此成功的主要原因之一:它们能够使用所有这些数据来学习不变性。原创 2025-04-10 11:41:43 · 658 阅读 · 0 评论 -
每日文献(十)——Part two
今天从第四部分 级联RCNN开始介绍。原创 2025-04-09 18:41:46 · 750 阅读 · 0 评论 -
每日文献(十)——Part one
目标检测是一个复杂的问题,需要解决两个主要任务。首先,检测器必须解决识别问题,将前景目标与背景目标区分开来,并为其分配合适的目标类别标签。其次,检测器必须解决定位问题,为不同的目标分配准确的边界框。这两种方法都特别困难,因为检测器面临许多“接近”误报,对应于“接近但不正确”的边界框。检测器必须找到真阳性,同时抑制这些接近的假阳性。目标检测是一个复杂的问题,需要解决两个主要任务。首先,检测器必须解决识别问题,将前景目标与背景目标区分开来,并为其分配合适的目标类别标签。原创 2025-04-07 11:54:59 · 1913 阅读 · 0 评论 -
每日文献(九)——Part two
今天从第三章:语义分割注意CNN模型开始介绍。原创 2025-04-06 17:11:31 · 1096 阅读 · 0 评论 -
每日文献(九)——Part one
目标检测是计算机视觉中研究最多的问题之一,即以边界框包围图像中每个的物体。由于深度学习发展,目标检测进展飞快.其中最著名的工作就是Sermanet等人使用的overfeat框架和Girshick等人的RCNN框架。Overfeat使用两个CNN模型,以滑动窗口的方式应用于图像的多个尺度。第一个用于对窗口是否包含对象进行分类,第二个用于预测对象的真实边界框位置。最后,将密集类和位置预测与贪婪算法合并,以产生最终的目标检测集。原创 2025-04-06 16:56:38 · 1048 阅读 · 0 评论 -
每日文献(八)——Part six
今天是最后一章,总结与回顾。原创 2025-04-05 15:00:00 · 228 阅读 · 0 评论 -
每日文献(八)——Part five
今天从第六章CNN应用开始。原创 2025-04-05 10:00:00 · 808 阅读 · 0 评论 -
每日文献(八)——Part four
今天从第五章节 CNN的迅速发展开始介绍。原创 2025-04-04 15:00:00 · 919 阅读 · 0 评论 -
每日文献(八)——Part three
今天从4.5节规则化开始介绍。原创 2025-04-04 10:00:00 · 711 阅读 · 0 评论 -
每日文献(八)——Part two
今天从3.3节 激活函数开始介绍。原创 2025-04-03 10:00:00 · 1021 阅读 · 0 评论 -
每日文献(八)——Part one
卷积神经网络(CNN)是一种著名的深度学习架构,其灵感来自于生物的自然视觉感知机制。1959年,Hubel & Wiesel等人发现动物视觉皮层中的细胞负责在接受区探测光线。受到这一发现的启发,福岛邦彦于1980年提出了新认知器,这可以被视为CNN的前身。1990年,LeCun et al.[3]发表了建立CNN现代框架的开创性论文,并在[3]中对其进行了改进。他们开发了一种多层人工神经网络,名为LeNet-5,可以对手写数字进行分类。原创 2025-04-02 15:05:15 · 1400 阅读 · 0 评论 -
每日文献(六)——Part two
今天从第三章:通用目标检测开始。原创 2025-03-31 19:18:00 · 750 阅读 · 0 评论 -
每日文献(七)
今天看《Deep Network-Enabled Haze Visibility Enhancement for Visual IoT-Driven Intelligent Transportation Systems》论文地址:https://drive.google.com/file/d/1EktkeJZDcI6AEgCYsYzzIwE9-JxbXxUN/view标题是“物联网驱动的可视智能交通系统的深度网络化雾霾能见度增强”The Internet of Things (IoT) has rece原创 2025-03-30 10:00:00 · 1465 阅读 · 0 评论 -
每天一篇目标检测文献(六)——Part One
为了理解图像,我们要对图像进行分类和精确定位其中目标的概念和位置,这就是“目标检测”。其中包含许多子任务:人脸检测、行人检测、骨架检测等等。原创 2025-03-29 10:00:00 · 1257 阅读 · 0 评论 -
YOLOv8中Anchor-Based、Anchor-Free及样本分配策略
本文主要介绍yolov8中的anchor机制与样本分配策略的静态策略和动态策略原创 2025-03-28 10:00:00 · 1087 阅读 · 0 评论 -
YOLOv8损失函数解读
本文主要介绍yolov8的损失函数部分代码和详解原创 2025-03-27 10:00:00 · 1789 阅读 · 0 评论 -
目标检测20年(四)——最终章
欢迎各位读者尽情阅读前三篇文献解读。这一篇将会介绍文献的第五部分:目标检测近些年的新技术发展以及第六部分:总结与未来展望。这也是本篇论文解读的最后一篇文章。原创 2025-03-26 10:00:00 · 1082 阅读 · 0 评论 -
YOLOv8代码解读
本文详细讲解yolov8的backbone骨干网络、head检测头和Detect层三部分代码。原创 2025-03-25 10:00:00 · 1668 阅读 · 0 评论 -
目标检测20年(三)
让检测器变得更快一直是一项具有挑战性的工作。加速技术可以分为“检测流水线”加速、“检测骨干(backbone)”加速和“数值计算”加速三个层次,原创 2025-03-24 15:17:23 · 966 阅读 · 0 评论 -
目标检测20年(二)
MS-COCO AP不是固定的IoU阈值,而是在0.5到0.95之间多个阈值进行平均,对性能要求更高。过去10年已经有许多知名数据集发布:PASCAL VOC挑战中的VOC2007、VOC2012,ImageNet大规模视觉识别挑战中的ILSVR2014.MS-COCO检测挑战中的Open Images Dataset等。挑战主要有两个任务:1、标准目标检测 2、视觉关系检测,即检测特定关系中的成对对象。标准检测任务的数据集由1910k图像和15440k在600个对象类别上标注的边界框组成。原创 2025-03-21 20:21:38 · 1055 阅读 · 0 评论 -
目标检测20年(一)
目标检测的目标是开发计算模型和技术,解决这样两个问题:目标是什么?目标在哪里?(其实就是分类和定位)目标检测是实例分割、图像字幕、目标跟踪等视觉任务的基础。深度学习的发展也让目标检测取得了巨大的进步,现在目标检测已经广泛应用于许多现实场景如自动驾驶、机器人视觉和视频监控等。下图展示了过去二十年里与“目标检测”相关刊物的出版:我们可以看到从1998年起刊物出版量逐步提升,2018年后增长幅度明显增加,且直到2021年都在持续增长。原创 2025-03-19 22:54:41 · 1240 阅读 · 0 评论 -
YOLOv8轻量化改进——Coordinate Attention注意力机制
现在针对YOLOv8的架构改进越来越多,今天尝试引入了Coordinate Attention注意力机制以改进对小目标物体的检测效率。原创 2025-03-17 15:59:44 · 1009 阅读 · 0 评论 -
每天一篇《目标检测》文献(五)
现有yolov8的改进算法较多,但大多模型计算量大,对边缘部署计算设备的硬件要求高。本文提出了一种更快、更轻的船舶检测算法。该算法首先引入CA注意力机制对检测目标进行定位,其次采用DualConv取代普通卷积Conv和C2f模块,减小网络计算量,更好地实现了轻型船舶目标的实时检测。原创 2025-03-14 10:30:00 · 984 阅读 · 0 评论 -
每天一篇《目标检测》文献(四)
从关注大尺寸特征图和引入Bi-PAN-FPN观点的角度,本工作提高了模型对小目标的检测性能,同时增加了多尺度特征融合获得更好特征工程的概率和时间。这解决了航空图像中小目标易误检和漏检的常见问题优化模型的骨干网络和损失函数。Ghostblock单元和Wise-IoU边界框回归损失被集成以从特征多样性、特征信息长距捕获以及避免几何因素过度惩罚等方面提高模型泛化能力。在提高模型准确性的同时减少模型参数数量。这解决了远程信息损失问题以及预测框平衡问题构建模型的可行性和有效性通过消融实验证明。原创 2025-03-13 10:30:00 · 1566 阅读 · 0 评论 -
每天一篇《目标检测》文献(三)
为了获取柑橘果实的准确特征信息,实现被遮挡柑橘的准确识别和定位,达到精确采 摘的目的,提出了一种改进的被遮挡柑橘果实识别模型构建。该模型在 YOLOv8 目标检测模 型中引入了 BAM 注意力机制,解决了被遮挡柑橘识别效果较差的问题,并采用支持向量机 (SVM)实例分割模型提取被遮挡柑橘的精确轮廓,实现被遮挡柑橘果实的精确识别。仿真 试验结果表明,与 YOLOv8 目标检测模型相比,该改进定位模型在被遮挡柑橘果实的平均定 位误差和果径误差率分别降低了16.29mm和8.03%。原创 2025-03-12 10:54:53 · 1684 阅读 · 0 评论 -
每天一篇《目标检测》文献(二)
无人机拍摄影像存在大量分布密集的小目标,针对通用目标检测方法对小目标容易造成漏检和错检的 问题,提出了一种改进 YOLOv8 的无人机航拍图像小目标检测算法。首先,利用高分辨率浅层特征信息具有 较小的感受野和更精细的空间信息特性,改进算法增加小目标物体检测头,采用四个特征检测头提升小目标 检测率。其次,设计构造 ConvSPD 卷积模块和 BiFormer 注意力增强模块的小目标检测模块组改进 YOLOv8 骨干网络,有效增强小目标浅层细节特征信息的捕获能力。原创 2025-03-11 10:30:41 · 1316 阅读 · 0 评论 -
每天一篇《目标检测》文献(一)
针对密集行人检测存在小目标检测精度低、模型复杂的问题,提出一种改进 YOLOv8 的轻量化密集 行人检测方法。引入 DualConv 模块替换原始 Conv 模块,帮助更深的卷积层更有效地提取信息,减少计算 冗余并提高检测精度;通过融合 RepViTBlock 结构和分离与增强注意力机制 SEMA(Separated and Enhancement Attention)改进 C2f,构建 RS-C2f 结构,提升模型的泛化和特征融合能力,并降低参数量;原创 2025-03-09 14:20:43 · 1144 阅读 · 0 评论 -
mmdetection框架下使用yolov3训练Seaships数据集
之前复现的yolov3算法采用的是传统的coco数据集,这里我需要在新的数据集上跑,也就是船舶检测方向的SeaShips数据集,这里给出教程。原创 2025-02-26 23:32:24 · 1189 阅读 · 0 评论 -
一文带你看懂目标检测!(四万字超全超详细版)
目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标或物体,并确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。原创 2025-02-07 16:46:54 · 1202 阅读 · 0 评论