SOD小目标检测
文章平均质量分 89
SOD小目标检测
Virgil139
谁终将点燃闪电,必长久如云漂泊。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Dogfight论文复现】无人机视频中检测无人机的目标检测模型
论文名称:Dogfight: Detecting Drones from Drones Videos任务:复现这篇文章的Dogfight模型,也就是再自己本地,NPS数据集上跑通这个模型的代码,得到模型,成功推理,并达到论文中的精度数据集准备→环境搭建→模型实现→训练配置→推理验证→精度调优。原创 2025-09-29 14:02:29 · 1208 阅读 · 0 评论 -
YOLO改进Head,SEAM和MultiSEAM代码实现
声明:SEAM模块的代码并非完全独立完成,部分有参考以及其他专栏的改进系列。原创 2025-09-28 20:48:33 · 268 阅读 · 4 评论 -
窥探黑箱——解释深度学习模型“为何有效”的理论、定律、思想
深度学习的有效性不是单一理论的支撑,而是**“底层数学理论(逼近、统计、优化)→中层设计思想(分层、聚焦、复用)→具体结构逻辑(感受野、残差、注意力)”** 的多层协同结果。理论是“指导”而非“万能公式”:所有理论都有假设条件(如万能逼近定理假设“激活函数连续”“紧集输入”),现实中需结合实验调整(如ReLU虽不连续,但实践中效果优于Sigmoid);实验是“验证与修正理论”的手段:如残差网络的提出,最初是为解决梯度消失的实验痛点,后续才出现严格的数学证明;“黑箱”仍有未解之谜。原创 2025-09-11 09:50:28 · 1019 阅读 · 0 评论 -
【YOLO11小目标改进】多尺度前馈网络(MSFN)代码
YOLO11涨点优化:小目标 |新颖的多尺度前馈网络(MSFN) | 2024年4月最新成果。加入以下代码到。原创 2025-08-31 00:10:47 · 350 阅读 · 2 评论 -
【SOD】小目标检测的设计原理
将目标物的bbox表示为xywh小目标:短边长度不小于4像素,长边不超过32像素。minwh≥4pixelmaxwh≤32pixel但具体的标准没有明确的标准,这里都统称为小目标检测。原创 2025-08-29 17:44:50 · 522 阅读 · 0 评论 -
【课设复现】面向水产养殖的图像识别系统
图像识别技术在降低水产养殖劳动力成本,提升养殖精细化程度等方面发挥巨大作用,其在水产养殖中具有广阔的应用前景。目前水产养殖中的计数及种类识别工作多依赖人工,而养殖物运动轨迹提取人工更难以完成。本文针对上述应用场景,基于深度学习设计了两种图像识别算法。其中基于 Yolov5 及 DeepSORT 算法的水下鱼类轨迹提取及计数算法,针对鱼类形态特征,调整了 DeepSORT 中特征提取网络结构,提高了轨迹提取及计数准确率。该。原创 2025-08-25 17:19:55 · 607 阅读 · 0 评论 -
ResNet怎么想出来的?ResNet二作张祥雨介绍。
张祥雨是人工智能计算机视觉(CV)领域的杰出人才,现任旷视研究院base model组负责人、旷视首席科学家,也是西安交通大学人工智能学院兼职教授。张祥雨2012年毕业于西安交通大学软件学院软件工程专业,获学士学位,之后在西安交通大学与微软亚洲研究院控制科学与工程专业学习,于2017年获得博士学位。在学期间,他曾拿下美国大学生数学建模竞赛(MCM)特等奖提名奖,凭借此获奖经历获得微软亚洲研究院实习资格,并最终成功留下。原创 2025-08-18 15:33:28 · 562 阅读 · 0 评论 -
baseline
将两个自定义配置文件复制到 PaddleDetection 框架的对应配置目录中。configs/picodet 是 PicoDet 模型的配置文件夹,ppq.yml 可能包含模型训练参数、网络结构配置等内容configs/datasets 用于存放数据集配置,voc_ppq.yml 可能定义了乒乓球数据集的路径、格式(如 Pascal VOC 标准)、类别信息等# 将当前目录下的 ppq.yml 文件,复制到 PaddleDetection 框架的 configs/picodet 目录!原创 2025-03-28 16:48:26 · 789 阅读 · 0 评论 -
【YOLO小目标改进】YOLOv8s-SOD
针对小目标检测中目标尺寸小、背景复杂等挑战,本文提出SOD-YOLO算法,通过在特征提取网络集成S_C2f_CAFM和SPPF_E模块、设计含SCAM的双向特征金字塔网络并引入D_C2f_MSPA模块,以及采用NWD损失函数,在DOTAv1.0等数据集上实现mAP较YOLOv8提升6.7%-11.9%且参数减少13.9%。原创 2025-06-08 20:38:23 · 1382 阅读 · 0 评论 -
TrackNet V1-V4进阶之路
本文聚焦 TrackNet 系列深度学习框架,该系列旨在解决体育视频中高速物体的跟踪难题。TrackNetV1 基于热图架构,利用多帧输入应对运动模糊和遮挡问题。TrackNetV2 借助 U - Net 跳连接、MIMO 设计及加权交叉熵损失函数提升效率。TrackNetV3 引入背景估计、混合增强和轨迹校正技术,进一步优化跟踪性能。TrackNetV4 则通过运动注意力图与视觉特征融合的创新方式,增强了对高速物体的跟踪能力。关键词:TrackNet;体育分析;目标跟踪;深度学习;运动注意力;轨迹校正。原创 2025-03-20 16:54:35 · 2042 阅读 · 2 评论 -
飞浆PaddleDetection套件介绍
在计算机视觉目标检测、实例分割等任务中,网络结构通常由骨干网络(Backbone)、颈部模块(Neck)和检测头(Head)组成。原创 2025-03-27 23:34:39 · 1421 阅读 · 0 评论 -
用PaddleDetection套件训练自己的数据集,PP-YOLO-SOD训练全流程
VOC格式数据集,训练集、验证集、测试集划分好,本别一个文件夹。PaddleDetection套件的所有配置文件都在。我下载的是PP-YOLOE+_SOD-l的模型。是官方的VOC数据集的配置文件,自己新建一个。直接运行以下命令安装 libgomp1。我下载的是PP-YOLOE+_l的模型。是官方的模型配置文件,自己新建一个。是官方的模型配置文件,自己新建一个。后面的模型配置文件中需要修改为。随后在模型配置文件中指定路径。随后在模型配置文件中指定路径。目录下,数据集的配置文件在。原创 2025-08-17 20:41:48 · 812 阅读 · 0 评论 -
PP-YOLOE-SOD
相比PP-YOLOE模型,PP-YOLOE-SOD改进点主要包括在neck中引入 Transformer全局注意力机制 以及在回归分支中使用 基于向量的DFL。Transformer在CV中的应用是目前研究较为火热的一个方向。最早的ViT直接将图像分为多个Patch并加入位置Embedding送入Transformer Encoder中,加上相应的分类或者检测头即可实现较好的效果。这里类似,主要加入了Position Embedding和Encoder两个模块,不同的是输入是最后一层特征图。原创 2025-08-21 13:45:51 · 394 阅读 · 0 评论 -
RepVGG与结构重参数化
在RepVGG中,训练时每个3×3卷积层都有平行的1×1卷积分支和恒等映射分支,进行等价转换为3×3卷积核,推理时还是简单的VGG的卷积块堆叠。但3乘3的卷积核不是直接将训练时的3×3 的卷积核保留下来这么简单。通过结构重参数化技术,将这些分支的参数(包括 3×3 卷积、1×1 卷积、恒等映射分支的参数以及各分支后的 BN 层参数)进行等价转换,合并为推理时单一的 3×3 卷积核参数。第二步将每个分支上的3x3卷积层融合成一个卷积层,合并的过程其实也很简单,直接将这三个卷积层的参数相加即可。原创 2025-06-29 20:53:19 · 837 阅读 · 0 评论 -
【SOD】有效感受野(ERF)可视化工具
In×3×h×wIn×3×h×w:输入图像nnn:批量大小(样本数),333:输入通道数(如RGB),hhhwww:图像的高和宽。Mn×c×h′×w′Mn×c×h′×w′:模型最终输出的特征图ccc:特征图通道数,h′h'h′w′w'w′:特征图的高和宽。关注对象:输出特征图MMM中每个通道的中心点——Mh′2w′2Mh′/2w′/2。原创 2025-07-13 19:36:11 · 1358 阅读 · 0 评论 -
【SOD】数据分布是如何影响目标检测精度
围绕“在YOLO系列模型训练中以最小投入(时间、数据量等)获取最大精度回报。原创 2025-07-16 01:48:13 · 956 阅读 · 0 评论 -
【SOD】数据集分析——衡量两个分布的相似度的指标
KL散度衡量一个概率分布P与另一个参考分布Q之间的信息损失,即“用Q来近似P时,所损失的信息量”。DKLP∣∣Q∑xPxlogPxQxDKLP∣∣Qx∑PxlogQxPx其中,PxP(x)Px是训练集某特征的概率分布(如“小目标占比30%”),QxQ(x)Qx是测试集对应特征的分布(如“小目标占比25%”)。物理意义:若P和Q完全一致,DKL0D_{KL}=0DKL0;原创 2025-07-18 14:46:13 · 1040 阅读 · 0 评论 -
【SOD】数据集分析——目标框的位置以及大小的分布
都集中在中心,并且上下边缘都没有目标。testB的可能因为数据量少中心有些偏左上角。原创 2025-07-18 23:37:34 · 320 阅读 · 0 评论 -
【SOD】如何提高目标检测模型在小目标检测任务(SOD)上的性能
下面给你一份(从“性价比最高的改动”到“进阶/研究向”)。按优先级逐步做,通常能明显拉升。原创 2025-08-17 23:46:25 · 912 阅读 · 0 评论
分享