MoPKL模型学习（与常见红外小目标检测方法）

原创

于 2025-09-17 22:31:40 发布 · 641 阅读

·

29

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#学习 #目标跟踪 #算法

红外小目标检测研究方向

1. 传统方法

形态学滤波方法：Top-hat 变换

差分滤波方法：LoG 滤波（Laplacian of Gaussian），DoG 滤波（Difference of Gaussian）

局部对比度与统计方法：局部对比度测量（LCM），局部熵（Local Entropy）

低秩 + 稀疏分解方法：RPCA（Robust PCA），LRR（Low-Rank Representation）

局部黑白场景的混合方法：滤波（DoG/LoG）+ 局部对比度：先增强，再做目标与背景差异检测；Top-hat + 局部熵：同时利用形态学与统计信息，提高鲁棒性；RPCA 结果再经过对比度增强，减少伪目标。

传统方法的缺陷：参数依赖强、对复杂背景不鲁棒、缺乏对弱小目标的适应能力、实时性与通用性不足

2. 基于运动信息的方法

帧差法（Frame Difference）：小目标在移动 → 差分后留下亮点；静态背景抵消。

光流法（Optical Flow）：计算像素点的运动向量场 (u,v)，小目标对应的光流方向/速度往往与背景不同。

时空滤波 / 三维卷积：把视频看作三维数据（x, y, t），设计时空滤波器或 3D 卷积：3D DoG/LoG：在三维空间提取局部亮点；ST-CNN / 3D-CNN：直接学习时空特征。

多帧积累 / 堆栈：累计帧差；滑动时间窗能量图；加权累计

运动先验建模：MoPKL / iMoPKL

3. 基于深度学习的单帧检测

改进的 U-Net / DenseNet / ResNet 编解码器；注意力机制；多尺度特征融合。

4. 基于多模态与跨模态的方法

可见光 + 红外；语言先验驱动；知识蒸馏。

5. 基于生成与对抗的方法

Related Works

单帧方法

1. MDvsFAcGan

站在 生成对抗网络 的角度，把检测中的错误类型（漏检、虚警）分解出来，用 GAN 学习更鲁棒的检测能力。

2. ACM

采用 编码器-解码器 网络（类似 U-Net），先得到多层次的特征映射；用 非对称结构 来融合它们（不是简单拼接，而是针对不同特征赋予不同权重/处理方式），得到一个更高效的综合表征。

3. AGPCNet

做了一个上下文金字塔，在多尺度上聚合上下文信息；并用注意力引导哪些上下文更有用。

AGCB：在特征图里同时建 局部关系（块内）和 全局关系（跨块），再用注意力引导。小范围抑制纹理噪声，大范围减少伪目标；

CPM：把多个尺度的 AGCB 并联，汇聚不同感受野的上下文。小目标大小多变，用多尺度金字塔保证都能被捕捉到。

AFM：在解码阶段，把浅层（定位强）和深层（语义强）特征用 不同机制融合。浅层靠空间注意守住位置，深层靠通道注意强化语义，两者互补。

4. DNANet

采用密集的、嵌套式的跳连（可理解为 U-Net++/Dense 连接风格），让高分辨率浅层细节与深层语义多次融合，降低小目标细节的损失。

5.

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。