《DiffusionDet: Diffusion Model for Object Detection》阅读笔记

论文地址:https://arxiv.org/pdf/2211.09788

项目地址:GitHub - ShoufaChen/DiffusionDet: [ICCV2023 Best Paper Finalist] PyTorch implementation of DiffusionDet (https://arxiv.org/abs/2211.09788)

---------------------------------------------------------------------------------------------------------------------------------

动机和背景:

        动机展示如图。作者认为噪声到框的范式哲学类似于去噪扩散模型中的噪声到图像过程,这类模型通过学习去噪模型逐渐去除图像中的噪声来生成图像。 扩散模型在许多生成任务中取得了巨大成功,开始在感知任务如图像分割中进行探索。然而,据作者所知,尚无成功将其应用于目标检测的先例。

Is there a simpler approach that does not even need the surrogate of learnable queries?

        作者提出了DiffusionDet,这是一种新框架,它将目标检测表述为从噪声框到目标框的去噪扩散过程。

大致过程:

        从纯随机框开始,这些框不包含需要在训练阶段优化的可学习参数。作者期望逐渐细化这些框的位置和大小,直到它们完美覆盖目标物体。 这种噪声到目标框的方法既不需要启发式的目标先验,也不需要可学习的查询,进一步简化了目标候选框,并推动了检测流程的发展。

方法细节:

Preliminaries
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值