论文笔记 Enhancing Camouflaged Object Detectors by Generating Camouflaged Objects, ICLR 2024.

动机

伪装物体检测(COD)是一项具有挑战性的任务,因其需要检测与背景视觉上高度融合的物体。尽管现有的COD检测器取得了一定的成功,但在面对极端伪装场景时仍然难以获得精确的结果。这种不准确性限制了COD技术在实际应用中的效果,如医学图像分析和物种发现。因此,论文希望通过从猎物与捕食者的博弈中获得灵感,开发出更先进的算法来提升COD检测器的性能。

贡献

  1. 提出Camouflageator框架:设计了一个对抗训练框架,包含辅助生成器和检测器,通过生成更难检测的伪装物体来提升检测器的泛化能力。
  2. 开发ICEG检测器:提出了一种新的COD检测器,专注于解决现有检测器在不完整分割和模糊边界方面的问题。
  3. 综合验证:通过在四个数据集上的广泛实验,验证了ICEG和Camouflageator在提升COD性能方面的有效性。
  4. 提供代码:论文宣布将开源相关代码,便于学术界和工业界进一步研究和应用。

创新点

  1. 双重策略启发:从猎物与捕食者博弈中获得启发,分别从猎物侧和捕食者侧开发算法。这种双重策略的设计理念在COD任务中是创新的。
  2. 对抗训练框架Camouflageator:引入了一个对抗训练框架,通过生成更难检测的伪装物体,提升了检测器的泛化能力。这个框架是灵活的,可以与各种现有的COD检测器结合使用。
  3. 新型检测器ICEG:开发了一个新的检测器,采用伪装特征一致性模块(CFC)和边缘引导分割解码器(ESD)来处理不完整分割和模糊边界问题。CFC模块通过特征聚合提高伪装物体的内部一致性,ESD模块通过边缘重建和引导分割减少边界模糊和误检测。
  4. 伪装一致性损失:提出了一种新的损失函数,增强了伪装物体的内部一致性,帮助生成更完整的分割结果。
  5. 边缘引导分割:结合边缘指导和前景/背景分离,减少了分割边缘的模糊和不确定性,取得了更清晰的分割边缘。

在这里插入图片描述
这张图展示了论文中提出的Camouflageator框架的架构和工作流程。该框架通过一个对抗训练的过程生成更加难以检测的伪装物体,从而增强COD检测器的泛化能力。具体解释如下:

图的整体概述

图分为两个阶段:Phase I和Phase II,并通过交替训练的方式迭代进行。Phase I中固定检测器 D s Ds Ds ,训练生成器 G c Gc Gc;Phase II中固定生成器 G c Gc Gc,训练检测器 D s Ds Ds

详细说明

Phase I
  1. 输入( x \textbf{x} x
    • 输入图像 x \textbf{x} x 是一张包含伪装物体的图像。
  2. 生成伪装物体 G c Gc Gc
    • 生成器 G c Gc Gc 接收输入图像X并生成伪装图像 x g \textbf{x}_g xg
  3. 损失计算
    • 生成器通过优化两个损失函数来进行训练:
      • Fidelity Loss ( L f L_f Lf):保持生成图像与原始图像在背景区域上的一致性。
      • Concealment Loss ( L c l L_{cl} Lcl):隐藏前景物体的辨别特征,使其更加难以检测。
    • 总损失函数为: L C a m = L f + λ L c l L_{Cam} = L_f + \lambda L_{cl} LCam=Lf+λLcl
  4. 欺骗检测器 D s Ds Ds
    • 生成的伪装图像 x g \textbf{x}_g xg 被输入到固定的检测器 D s Ds Ds ,检测器试图分割出前景物体。
    • 检测器的输出应尽量没有前景物体,以证明生成器成功地生成了难以检测的伪装物体。
    • 用于训练生成器的附加损失: L s a = L B C E w ( D s ( x g ) , y z ) + L I o U w ( D s ( x g ) , y z ) L_s^a = L^w_{BCE}(Ds(\textbf{x}_g), \textbf{y}_z) + L^w_{IoU}(Ds(\textbf{x}_g), \textbf{y}_z) Lsa=LBCEw(Ds(xg),yz)+LIoUw(Ds(xg),yz),其中 y z \textbf{y}_z yz是全零掩码,表示没有前景物体。
Phase II
  1. 输入(Xg)
    • 生成器生成的伪装图像 x g \textbf{x}_g xg 再次被输入到固定的生成器 G c Gc Gc 中。
  2. 训练检测器 D s Ds Ds
    • 生成的伪装图像 x g \textbf{x}_g xg 被输入到检测器 D s Ds Ds ,此时检测器进行训练以准确分割出伪装图像中的前景物体。
    • 使用的损失函数为: L s C a m = L B C E w ( D s ( x g ) , y ) + L I o U w ( D s ( x g ) , y ) L_{s}^{Cam} = L^w_{BCE}(Ds(\textbf{x}_g), \textbf{y}) + L^w_{IoU}(Ds(\textbf{x}_g), \textbf{y}) Ls
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值