ICCV 2025 | 南开&南邮提出DISTA-Net:动态稀疏重建新范式,破解密集红外小目标解混难题!

点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达

在红外成像领域,当远距离目标以密集簇形式出现时,重叠的信号会形成模糊的光斑,使得人类视觉和传统算法都难以分辨目标的数量、精确位置和辐射强度。这一难题长期困扰着红外搜索与跟踪系统的性能提升。近日,由Shengdong Han等学者提出的DISTA-Net模型,为解决这一挑战带来了革命性突破。

论文信息

题目:DISTA-Net: Dynamic Closely-Spaced Infrared Small Target Unmixing
DISTA-Net:动态密集间隔红外小目标解混
作者:Shengdong Han、Shangdong Yang、Yuxuan Li、Xin Zhang、Xiang Li、Jian Yang、Ming-Ming Cheng、Yimian Dai
源码:https://github.com/GrokCV/GrokCSO

红外成像的"迷雾":密集小目标检测的困境

想象一下,在远距离红外监控中,多个目标紧密排列形成的光斑往往重叠在一起,看起来就像一个模糊的亮点(如图1所示)。这种现象被称为紧密间隔红外小目标(CSIST),由于艾里斑干扰,传统的目标检测算法往往束手无策。

紧密间隔红外小目标示意图
紧密间隔红外小目标示意图

传统方法通常采用稀疏重建技术,但这些方法高度依赖人工调整的超参数,当目标数量或位置变化时,性能会急剧下降。而深度学习在该领域的应用长期面临三大障碍:缺乏标准化数据集、没有专用评估指标、缺少开源工具包。

三大创新点:DISTA-Net的核心突破

1. 动态解混网络:让AI学会"自适应调整"

DISTA-Net(动态迭代收缩阈值网络)的最大创新在于将传统稀疏重建方法重构为动态深度学习框架。与固定参数的传统模型不同,该网络能够根据输入数据实时生成卷积权重和阈值参数,就像给AI配备了"自适应眼镜",可以根据场景自动调整焦距。

这种动态特性使其能够处理不同密度、不同辐射强度的目标簇,解决了传统方法在复杂场景下泛化能力差的问题。

2. 数据自适应非线性变换:突出关键特征

研究团队设计了独特的数据自适应非线性变换函数,能够将图像映射到更丰富的维度空间,同时自动突出重要区域。配合动态阈值模块(如图4左侧所示),该函数能根据输入图像的变化灵活调整,避免了固定参数过严或过松的弊端。

DISTA-Net动态阈值模块
DISTA-Net动态阈值模块

动态阈值模块通过双卷积层捕获多尺度特征,结合空间选择性掩码生成自适应阈值,使网络对密集重叠目标的处理能力显著提升。

3. 首个开源生态系统:推动领域发展

为了打破研究壁垒,团队构建了包含三大组件的开源生态系统:

  • CSIST-100K数据集:包含10万对标注图像,每张图像含1-5个重叠目标,标注精度达亚像素级别

  • CSO-mAP评估指标:针对亚像素检测设计,能同时评估目标数量、位置和辐射强度

  • GrokCSO工具包:基于PyTorch的开源工具,封装了多种先进模型和评估脚本

DISTA-Net架构解析:动态框架的力量

DISTA-Net的整体架构如图4所示,由N个迭代阶段组成,每个阶段包含动态变换、动态软阈值化和逆变换三个核心组件。

DISTA-Net整体架构
DISTA-Net整体架构

动态变换模块:双分支特征增强

该模块通过两个并行分支处理输入:

  • 主分支:采用Conv-ReLU-Conv结构提取基础特征

  • 辅助分支:根据输入动态生成卷积核,对特征进行自适应增强

通过这种设计,网络能够有效处理稀疏图像的扰动敏感性,增强关键特征表示。

动态软阈值生成:智能筛选重要信息

动态阈值生成器通过多尺度特征提取和空间注意力机制,生成与输入匹配的阈值参数。这种机制使网络能够在复杂背景中准确区分目标信号和噪声,尤其适合处理密集重叠的目标场景。

实验验证:性能全面超越传统方法

在CSIST-100K数据集上的测试结果显示,DISTA-Net在各项指标上均显著领先:

定量指标领先

  • CSO-mAP达到46.74%,超越传统ISTA方法和其他深度展开模型

  • AP-20(0.2像素精度要求)达到86.18%,接近亚像素划分的理论极限

  • PSNR和SSIM分别达到37.87和99.79,图像重建质量最优

不同方法性能对比
不同方法性能对比

视觉效果惊艳

在包含3-5个目标的密集场景中(如图5),DISTA-Net能够清晰分离重叠目标,保持准确的空间分布和边界,而传统方法则出现明显的模糊和合并现象。

不同方法视觉效果对比
不同方法视觉效果对比

消融实验验证

通过消融实验(表2)可以看出,动态变换和动态阈值模块对性能提升至关重要,其中动态阈值模块的贡献更为显著。

消融实验结果
消融实验结果

总结与展望

DISTA-Net的提出首次将深度学习应用于密集间隔红外小目标解混任务,其动态网络设计为解决类似的稀疏信号重建问题提供了新思路。开源生态系统的建立则为该领域的持续发展奠定了基础。

未来,随着红外成像技术的进步,该方法有望在远距离监控、导弹预警、空间探测等领域发挥重要作用。研究团队也计划进一步优化模型效率,拓展其在实时系统中的应用。

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。


下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。


下载3:人工智能0基础学习攻略手册
在「小白学视觉」公众号后台回复:攻略手册,即可获取《从 0 入门人工智能学习攻略手册》文档,包含视频课件、习题、电子书、代码、数据等人工智能学习相关资源,可以下载离线学习。


交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小白学视觉

您的赞赏是我们坚持下去的动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值