U2-Net 使用嵌套 U 结构进行更深入的显着目标检测

本文介绍了U²-Net,一种用于显着目标检测的U-Net变体。U²-Net采用两层嵌套的U结构,通过Residual U-Block捕获不同尺度的上下文信息,同时保持较低的计算成本。文章详细阐述了其网络设计,包括编码器-解码器结构和显着性图融合模块,展示了在显着性物体检测任务中的优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在给定图像中分割不同的对象一直是计算机视觉领域的一项众所周知的任务。多年来,我们已经看到自编码器到疯狂的深度学习模型(如 Deeplab)被用于语义分割。在所有模型的深海中,仍然有一个名字排在最前面,它就是U-Net。U-Net 于 2018 年发布,此后获得了巨大的普及,并以某种形式用于与分割相关的多种不同任务。在这篇博客中,我们将介绍 U-net 的一种变体,称为 U²-Net 或 U-squared Net。U²-Net 基本上是由 U-Net 构成的 U-Net。

因此,事不宜迟,让我们进入这篇精彩的论文。U²-Net 是为显着目标检测或 SOD而设计的。对于那些不知道的人,显着性物体检测基本上是检测给定图像中最重要或主要的物体。

在这里插入图片描述

主要进展

我们的 U2-Net 的架构是一个两层嵌套的 U 结构。该设计具有以下优点:

由于在我们提出的 ReSidual U 块 (RSU) 中混合了不同大小的感受野,它能够从不同尺度捕获更多上下文信息。
由于这些 RSU 块中使用的池化操作,它增加了整个体系结构的深度而不会显着增加计算成本。

拟建网络

Residual U-Block:局部和全局上下文信息对于显着目标检测和其他分割任务都非常重要。为了降低内存和计算量,VGG16、ResNet 或 DenseNet 等网络使用较小尺寸的过滤器,通常为 1x1 或 3x3。在下图中,我们可以

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

知识大胖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值