伪装目标检测模型论文阅读之：Zoom in and out

原创

已于 2024-03-02 20:45:19 修改 · 2k 阅读

31 ·

CC 4.0 BY-SA版权

文章标签：

#目标检测 #论文阅读 #人工智能 #深度学习 #图像处理 #计算机视觉

于 2024-01-15 23:20:43 首次发布

本文介绍了一种新颖的混合尺度网络ZoomNet，针对遮挡对象检测(COD)问题，通过尺度集成和分层混合尺度单元学习区分性特征，结合不确定性感知损失优化，实现在复杂场景中有效检测。模型在多个数据集上表现出色，并在SOD任务中超越现有方法。

论文链接：https://arxiv.org/abs/2203.02688
代码;https://github.com/lartpang/zoomnet

1.摘要

最近提出的遮挡对象检测（COD）试图分割视觉上与其周围环境融合的对象，这在现实场景中是非常复杂和困难的。除了与它们的背景具有高度的内在相似性之外，这些对象通常在尺度上是多样的，外观上是模糊的，甚至严重遮挡。为了解决这些问题，我们提出了一种混合尺度三元网络，ZoomNet，模仿人类观察模糊图像时的行为，即放大和缩小。具体来说，我们的ZoomNet采用缩放策略，通过设计的尺度集成单元和分层混合尺度单元来学习区分性混合尺度语义，充分挖掘候选对象和背景环境之间的不可感知线索。此外，考虑到不可区分的纹理所带来的不确定性和模糊性，我们构造了一个简单而有效的正则化约束，即不确定性感知损失，以促进模型在候选区域中准确地产生具有更高置信度的预测。我们提出的高度任务友好的模型在四个公共数据集上始终超过现有的23种最先进的方法。此外，在SOD任务上优于最近的尖端模型的上级性能也验证了我们模型的有效性和通用性。

2.主要贡献

1.在COD任务中，我们提出了一种混合尺度的三元组网络ZoomNet，它通过描述和统一不同“缩放”尺度下的特定尺度的外观特征以及有针对性的优化策略，可以有效地捕获复杂场景中的对象。
2.为了获得被捕获对象的区分性特征表示，我们设计了SIU和HMU进行提取，聚合和加强特定于尺度和微妙的语义表示，以获得准确的COD。
3.我们提出了一种简单而有效的优化增强策略，UAL，该模型在不增加额外参数量的情况下，可以有效地抑制背景的不确定性和干扰
在4个COD数据集上对7种度量标准下的方法进行了比较，并在SOD任务中表现出了很好的泛化能力，与现有的SOD方法相比具有上级性能。