MoPKL模型学习(与常见红外小目标检测方法)

红外小目标检测研究方向

1. 传统方法

形态学滤波方法:Top-hat 变换

差分滤波方法:LoG 滤波(Laplacian of Gaussian),DoG 滤波(Difference of Gaussian)

局部对比度与统计方法:局部对比度测量(LCM),局部熵(Local Entropy)

低秩 + 稀疏分解方法:RPCA(Robust PCA),LRR(Low-Rank Representation)

局部黑白场景的混合方法:滤波(DoG/LoG)+ 局部对比度:先增强,再做目标与背景差异检测;Top-hat + 局部熵:同时利用形态学与统计信息,提高鲁棒性;RPCA 结果再经过对比度增强,减少伪目标。

传统方法的缺陷:参数依赖强、对复杂背景不鲁棒、缺乏对弱小目标的适应能力、实时性与通用性不足

2. 基于运动信息的方法

帧差法(Frame Difference):小目标在移动 → 差分后留下亮点;静态背景抵消。

光流法(Optical Flow):计算像素点的运动向量场 (u,v),小目标对应的光流方向/速度往往与背景不同。

时空滤波 / 三维卷积:把视频看作三维数据(x, y, t),设计时空滤波器或 3D 卷积:3D DoG/LoG:在三维空间提取局部亮点;ST-CNN / 3D-CNN:直接学习时空特征。

多帧积累 / 堆栈:累计帧差;滑动时间窗能量图;加权累计

运动先验建模:MoPKL / iMoPKL

3. 基于深度学习的单帧检测

改进的 U-Net / DenseNet / ResNet 编解码器;注意力机制;多尺度特征融合。

4. 基于多模态与跨模态的方法

可见光 + 红外;语言先验驱动;知识蒸馏。

5. 基于生成与对抗的方法

Related Works

单帧方法

1. MDvsFAcGan

站在 生成对抗网络 的角度,把检测中的错误类型(漏检、虚警)分解出来,用 GAN 学习更鲁棒的检测能力。

2. ACM

采用 编码器-解码器 网络(类似 U-Net),先得到多层次的特征映射;用 非对称结构 来融合它们(不是简单拼接,而是针对不同特征赋予不同权重/处理方式),得到一个更高效的综合表征。

3. AGPCNet

做了一个上下文金字塔,在多尺度上聚合上下文信息;并用注意力引导哪些上下文更有用。

AGCB:在特征图里同时建 局部关系(块内)和 全局关系(跨块),再用注意力引导。小范围抑制纹理噪声,大范围减少伪目标;

CPM:把多个尺度的 AGCB 并联,汇聚不同感受野的上下文。小目标大小多变,用多尺度金字塔保证都能被捕捉到。

AFM:在解码阶段,把浅层(定位强)和深层(语义强)特征用 不同机制融合。浅层靠空间注意守住位置,深层靠通道注意强化语义,两者互补。

4. DNANet

采用密集的、嵌套式的跳连(可理解为 U-Net++/Dense 连接风格),让高分辨率浅层细节与深层语义多次融合,降低小目标细节的损失

5.
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值