红外小目标检测研究方向
1. 传统方法
形态学滤波方法:Top-hat 变换
差分滤波方法:LoG 滤波(Laplacian of Gaussian),DoG 滤波(Difference of Gaussian)
局部对比度与统计方法:局部对比度测量(LCM),局部熵(Local Entropy)
低秩 + 稀疏分解方法:RPCA(Robust PCA),LRR(Low-Rank Representation)
局部黑白场景的混合方法:滤波(DoG/LoG)+ 局部对比度:先增强,再做目标与背景差异检测;Top-hat + 局部熵:同时利用形态学与统计信息,提高鲁棒性;RPCA 结果再经过对比度增强,减少伪目标。
传统方法的缺陷:参数依赖强、对复杂背景不鲁棒、缺乏对弱小目标的适应能力、实时性与通用性不足
2. 基于运动信息的方法
帧差法(Frame Difference):小目标在移动 → 差分后留下亮点;静态背景抵消。
光流法(Optical Flow):计算像素点的运动向量场 (u,v),小目标对应的光流方向/速度往往与背景不同。
时空滤波 / 三维卷积:把视频看作三维数据(x, y, t),设计时空滤波器或 3D 卷积:3D DoG/LoG:在三维空间提取局部亮点;ST-CNN / 3D-CNN:直接学习时空特征。
多帧积累 / 堆栈:累计帧差;滑动时间窗能量图;加权累计
运动先验建模:MoPKL / iMoPKL
3. 基于深度学习的单帧检测
改进的 U-Net / DenseNet / ResNet 编解码器;注意力机制;多尺度特征融合。
4. 基于多模态与跨模态的方法
可见光 + 红外;语言先验驱动;知识蒸馏。
5. 基于生成与对抗的方法
Related Works
单帧方法
1. MDvsFAcGan
站在 生成对抗网络 的角度,把检测中的错误类型(漏检、虚警)分解出来,用 GAN 学习更鲁棒的检测能力。
2. ACM
采用 编码器-解码器 网络(类似 U-Net),先得到多层次的特征映射;用 非对称结构 来融合它们(不是简单拼接,而是针对不同特征赋予不同权重/处理方式),得到一个更高效的综合表征。
3. AGPCNet
做了一个上下文金字塔,在多尺度上聚合上下文信息;并用注意力引导哪些上下文更有用。
AGCB:在特征图里同时建 局部关系(块内)和 全局关系(跨块),再用注意力引导。小范围抑制纹理噪声,大范围减少伪目标;
CPM:把多个尺度的 AGCB 并联,汇聚不同感受野的上下文。小目标大小多变,用多尺度金字塔保证都能被捕捉到。
AFM:在解码阶段,把浅层(定位强)和深层(语义强)特征用 不同机制融合。浅层靠空间注意守住位置,深层靠通道注意强化语义,两者互补。
4. DNANet
采用密集的、嵌套式的跳连(可理解为 U-Net++/Dense 连接风格),让高分辨率浅层细节与深层语义多次融合,降低小目标细节的损失。

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



