
目标检测知识总结
文章平均质量分 88
该专栏主要是介绍目标检测的知识点、实战经历等知识
夜深人静打代码
对深度学习感兴趣的菜鸡
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
YOLOv9模型重新参数化,将yolo.pt转为yolo-converted.pt
本文主要介绍了如何对YOLOv9模型进行重新参数化,可以将普通的yolo模型转为yolo-converted模型,在保持精度不变的情况下,加快推理速度、减小模型复杂度。原创 2024-10-30 20:40:54 · 1191 阅读 · 4 评论 -
计算机视觉常用数据集Foggy Cityscapes的介绍、下载、转为YOLO格式进行训练
大雾城市景观Foggy Cityscapes (F):Foggy Cityscapes是由 Cityscapes 生成的合成数据集,它旨在模拟和研究自动驾驶车辆在雾天条件下的性能,有三个级别的大雾天气(0.005,0.01,0.02),从轻微的雾到浓厚的雾,分别对应于600,300和150米的能见度范围。由于雾天条件下的能见度降低,图像中的许多目标会变得模糊不清,这对计算机视觉检测来说是一个挑战。Foggy Cityscapes 为研究人员提供了一个测试和改进算法的机会,以提高在恶劣条件下算法的鲁棒和准确性原创 2024-10-30 12:58:22 · 4050 阅读 · 18 评论 -
计算机视觉常用数据集Cityscapes的介绍、下载、转为YOLO格式进行训练
城市景观Cityscapes(C):Cityscapes 收集了50个不同城市良好天气条件下的城市街景,总共包含5000张真实城市场景图像;其中3475张带标注信息的图像用于训练验证(2,975张图像用于训练,500张用于验证),剩下1525张无标注信息图像用于测试。Cityscapes数据集是计算机视觉领域常用的数据集,它的高质量标注和丰富场景使其成为评估和训练算法的理想选择。原创 2024-10-29 16:27:28 · 10007 阅读 · 37 评论 -
详解数据增强中的平移shft操作
是指在数据增强(data augmentation)过程中,通过对输入图像或目标进行位置偏移(平移),让目标在图像中呈现出不同的位置。Shift 平移的目的是增加训练数据的多样性,从而提高模型对目标在不同位置上的泛化能力。假设我们有一张 255×255像素的图像,目标位于中心位置。原创 2025-01-11 11:12:25 · 1410 阅读 · 0 评论 -
什么是卷积网络中的平移不变性?平移shft在数据增强中的意义
Shift 平移是指在数据增强(data augmentation)过程中,通过对输入图像或目标进行位置偏移(平移),让目标在图像中呈现出不同的位置。Shift 平移的目的是增加训练数据的多样性,从而提高模型对目标在不同位置上的泛化能力。1.1、平移的定义平移是将目标或图像内容在水平或垂直方向上移动。平移范围(shift range):定义平移的最大像素数,例如 ±16 像素表示目标可以随机移动 -16 到 +16 像素。1.2、操作步骤以图像为例:输入。原创 2025-01-11 10:39:10 · 1479 阅读 · 0 评论 -
目标检测跟踪中的Siamese孪生网络与普通卷积网络(VGG、ResNet)有什么区别?
Siamese网络又叫孪生网络,是一种特殊的神经网络架构,由一对(或多对)共享参数的子网络组成,用于学习输入样本之间的相似性或关系。最早在 1994 年由 Bromley 等人提出,最初被用于签名验证任务。目前广泛应用于目标检测跟踪领域中,基本已经作为目标跟踪的backbone了。例如,人脸识别场景中,如果你需要在一个大规模数据库中快速找到与给定人脸最相似的人,Siamese 网络会更高效和灵活。例如人脸验证(是否是同一个人)、签名验证。学习样本之间的相似性度量。如图像检索、推荐系统。原创 2025-01-11 10:20:03 · 1498 阅读 · 1 评论 -
目标检测中的正负样本是什么,是如何起作用的?
Anchor-based中,如果一个候选框(Anchor)与目标框的重叠程度(IoU,交并比)大于一定阈值,可以被认为是正样本。而如果该检测框被认为是负样本,也就是模型认为该检测框没有框中感兴趣的目标,仅仅是包含了一些背景,那么该框仅仅会进行置信度的预测。对于一个检测框,如果被认为是正样本(有目标),则yi=1,那么等式右边的第二项就为0了,此时变成了。对于一个检测框,如果被认为是负样本(纯背景),则yi=0,那么等式右边的第一项就为0了,此时变成了。,预测置信度越接近大,则Lobj也越大。原创 2024-12-28 15:33:55 · 1588 阅读 · 0 评论 -
域适应(Domain Adaptation, DA)、域泛化(Domain Generalization, DG)和测试时域适应(Test Time Adaptation, TTA)之间的区别与联系
域适应(Domain Adaptation, DA)、域泛化(Domain Generalization, DG)和测试时域适应(Test Time Adaptation, TTA)是迁移学习领域中处理分布差异的三个重要概念,它们既有联系也有区别原创 2024-10-31 10:35:25 · 2071 阅读 · 0 评论 -
介绍目标检测中mAP50和mAP50-95的区别
在目标检测任务中,mAP(mean Average Precision)是一个常用的性能评估指标,用于衡量模型在不同类别和不同IoU(Intersection over Union)阈值下的平均精度。其中mAP50和mAP50-95是mAP的两个特定版本。原创 2024-11-01 11:28:05 · 26489 阅读 · 0 评论