Nested Network with Two-Stream Pyramid for Salient Object Detection in Optical Remote Sensing Image

本文提出了LV-Net,一个用于光学遥感图像(RSI)显著目标检测的深度学习模型。该模型包含L型的双流金字塔模块和V型的嵌套链接编码器-解码器模块。L型模块解决尺度多样性,V型模块抑制背景,突出显著对象。实验证明LV-Net在光学RSI显著性检测中优于其他方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原文下载地址:https://arxiv.org/pdf/1906.08462.pdf

本文提出LV-Net,其包含两个关键模块:一个双流的金字塔模块(L形状),一个使用了嵌套链接的编码器-解码器模块。

具体嵌套连接的解释,详见https://blog.youkuaiyun.com/zhaoyinfu8021/article/details/93379764

具体的,该L形状的模块使用双流金字塔结构,将一系列互补的信息层次化的抽取出来。这一步,可以保留显著对象的的多样尺度和局部细节。

V形状的模块,逐渐的将编码器的细节特征与解码器的语义特征通过nested connections的方式连接起来,目的是抑制杂乱的背景且对于显著性目标进行高亮化处理。

本文中,自然场景图像(总是RGB格式的)指的是由手持照相机或悬挂在地面上的某一个物体上的相机捕捉到的图像,其中,由此类相机拍摄到的图像中对象都是竖直方向的。

常见的目标检测,显著性目标检测和异常检测三者之间的差别:目标检测是一个以检测出所有物体的通用性任务,显著性目标检测只管至于发现显著性目标,异常检测用于发现异常对象。同时,目标检测和异常检测总是使用bounding boxes来描画对象,而显著性目标检测是产生像素级别的显著性概率图

与其他论文相同,使用的诗句来源于Google Earth,且分辨路范围为0.5m-2m。与自然场景图象相比,RSIs中的对象总是有很多不同的朝向,尺寸和类型。同时,光学RSI图像与高频谱图像不同,高频谱图像具有更多的频带信息。而光学RSI包含很多人眼友好的颜色表示。

由于光学RSI总是以一个高角度拍摄户外,所以,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值