横扫CVPR!“特征融合+目标检测”封神!

相比传统,基于特征融合做目标检测,不仅克服了特征表达不充分的缺陷,还能与YOLO、Transformer、Mamba等技术充分结合。在提升模型检测精度、鲁棒性的同时,也拓展了应用领域(多尺度、遮挡、形变……)

因此,其在各大顶会都备受欢迎,光是CVPR就有多篇。比如在3D目标检测任务中性能狂提88.5%的模型CoHFF;在稀疏监督目标检测中性能远超SOTA的HINTED模型……

值得一提的是,该方向由于开源代码多、涉及场景丰富,发文门槛很低,妥妥的毕业“神器”!想发论文的伙伴,可以从这些方向着手:动态自适应融合、跨模态扩展、计算效率与精度平衡、特定场景优化等。

为方便大家研究的进行,我给大家准备了15篇必读的前沿论文和源码,可以无偿分享给你!

论文原文+开源代码需要的同学看文末

EDNet: Edge-Optimized Small Target Detection in UAV Imagery- Faster Context Attention, Better Feature Fusion, and Hardware Acceleration

内容:本文介绍了一种名为EDNet的新型边缘优化小目标检测框架,基于改进的YOLOv10架构。EDNet通过引入XSmall检测头、交叉拼接策略和快速上下文注意力模块,显著提升了无人机图像中小目标的检测性能,同时优化了计算复杂度。此外,该框架还采用了WIoU损失函数以改善边界框回归,并提供了从Tiny到XL的七种模型变体,以适应不同的边缘设备部署需求。实验结果表明,EDNet在VisDrone数据集上实现了高达5.6%的mAP@50提升,同时在iPhone 12等移动设备上实现了16到55 FPS的实时推理速度,展现了其高效性和可扩展性。

HINTED: Hard Instance Enhanced Detector with Mixed-Density Feature Fusion for Sparsely-Supervised 3D Object Detection

内容:本文提出了一种名为HINTED的稀疏监督3D目标检测方法,旨在解决稀疏标注场景中难以检测到的“硬实例”(如结构不完整或距离较远的目标)问题。HINTED通过引入自增强教师模型生成更多潜在伪标签以提高信息传递效率,并结合混合密度学生模型,通过不同密度特征的融合来增强对硬实例的检测能力。在KITTI数据集上的实验表明,HINTED在硬实例检测上显著优于现有的稀疏监督方法,尤其在行人和骑自行车者等挑战性类别上,性能提升超过30%和25%。

Quality-aware Selective Fusion Network for V-D-T Salient Object Detection

内容:本文提出了一种名为QSFNet的网络架构,用于可见光-深度-热成像(VDT)的显著目标检测任务。QSFNet通过三个子网络实现:初始特征提取子网络、质量感知区域选择子网络和区域引导的选择性融合子网络。该网络能够感知不同模态图像的质量,通过生成质量感知图来选择高质量和低质量区域,并在融合过程中突出高质量信息、抑制低质量干扰。实验结果表明,QSFNet在VDT-2048数据集上显著优于13种现有方法,尤其是在处理低质量深度和热成像图像时表现出色。

PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection

内容:本文提出了一种名为PointOBB-v3的单点监督定向目标检测框架,旨在通过单点标注实现高效的定向边界框(OBB)生成。PointOBB-v3通过引入三种独特的图像视图(原始视图、缩放视图和旋转/翻转视图)和渐进式多视图切换策略,结合尺度增强模块和角度获取模块,分别提升模型对目标尺度和角度的感知能力。该框架还引入了尺度敏感一致性(SSC)损失、尺度敏感特征融合(SSFF)模块、自监督角度(SSA)损失和密集到稀疏(DS)匹配策略,以提高尺度估计和角度预测的精度。

码字不易,欢迎大家点赞评论收藏!

关注下方《AI科研技术派》

回复【特征检测】获取完整论文

👇

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值