论文题目:Balanced Density Regression Network for Remote Sensing Object Counting

论文题目:Balanced Density Regression Network for Remote Sensing Object Counting

摘要:

在遥感图像中计数物体对于分析其在图像中的分布至关重要。与监控视角相比,在遥感图像中计数密集物体更具挑战性,因为这些目标的尺寸较小。最近,许多方法利用高斯卷积回归来估计遥感图像中密集物体的数量。然而,大多数方法忽略了高斯分布中固有的回归不平衡问题,这是由中心区域和边缘区域的数值差异引起的。为了应对这一挑战,我们提出了一种平衡密度回归网络(BDRNet),以减轻由于数值差异导致的高斯分布中的回归不准确性。与其他方法不同,我们将回归问题分为两个步骤:首先关注感兴趣的区域,然后实现精确回归。BDRNet包括一个自适应核权重注意力(AKWA)机制和一个逐像素占用预测模块。首先,AKWA旨在获取准确的语义特征信息,这是通过学习不同感受野大小的扩张卷积的权重来获得的。其次,逐像素占用估计(PwOE)模块将高斯位置嵌入应用于点标签,以约束网络专注于目标区域,而无需增加注释成本。最后,逐像素占用预测特征和核权重特征的整合形成了多层交叉注意力机制,促进了通道级特征交互,并提高了密度回归预测的准确性。因此,高斯核的中心和边缘区域得到了平等对待,回归得以平衡。

Part01 研究贡献

1.文章提出了AKWA模块,该模块能够学习来自不同感受野的特征权重,从而提高遥感图像特征提取的准确性。
2.文章提出了PwOE模块,该模块利用二值分割形成交叉注意力机制,确保在高斯核的各个区域中得到平等的处理,并在目标区域中实现更准确的预测。
3.我们提出了BDRNet框架,并在多个不同的数据集上进行了广泛的实验。实验结果表明,所提出的BDRNet有效地解决了高斯核回归中的区域不平衡问题,并取得了更好的远程计数结果。

Part02模型结构

本节介绍了一个名为BDRNet的算法,其架构在图2中描绘。鉴于遥感图像中目标的典型尺寸较小,文章采用多尺度结构以便于详细目标特征提取。具体来说,VGGNet作为主干网络来成多尺度特征。随后,多层特征网络通过少量可变形卷积结构学习同类目标的通用特征。这种效果源于可变形卷积的感受野,其自动调整偏差,与目标特征更加紧密对齐。此外,为了使网络能够学习更准确的目标位置信息,模型设计了一个AKWA机制。该机制将不同大小感受野提取的特征视为键,允许网络自主地为不同感受野特征分配权重,从而从不同感受野中选择最合适的特征。因此,用于产生最终回归结果的特征将更具区分性。

另外,由于高斯分布在数值上的不同,高斯核对目标位置的影响有限,特别是对于远离核中心的点。远离高斯核中心的点的值很小,这对网络回归构成挑战,导致目标位置的表示减弱。因此,我们引入了一个PwOE模块,该模块根据真实点创建高斯位置嵌入先验。这些嵌入先验作为监督数据,引导模型准确识别目标位置。这种方法将位置先验作为网络中的查询,建立了一个交叉注意力机制。

算法详细结构见图1。
图1

图1 BDRNet网络架构图

Part03数据集

文章用来四个数据集进行训练。

  1. CARPK和PUCPR数据集:CARPK(停车场)和PUCPR(巴拉那天主教大学)数据集包含了由无人机拍摄的不同地点的车辆图像。CARPK数据集总共包含1448张图像,训练集和测试集的具体划分由官方提供的列表决定。其中,989张图像用于形成训练集,剩余的459张图像用于测试。在PUCPR数据集中,总共有100张图像用于训练模型,剩余的25张图像用于测试模型的性能。
  2. RSOC数据集:遥感对象计数(RSOC)建筑数据集主要来源于卫星遥感图像分割,包括各种建筑密集的场景。RSOC建筑包含1205张训练图像和1263张测试图像,整个数据集总共有2468张图像。RSOC船舶数据集从航空图像中的对象检测(DOTA)数据集中选取,包括包含船舶的图像。具体来说,RSOC船舶数据集包含137张图像,其中97张用于训练,剩余的40张用于测试。与RSOC船舶数据集类似,RSOC小型车辆数据集包含从DOTA数据集中提取的小型车辆图像。它总共包含280张车辆图像,其中222张用于训练,58张用于测试。RSOC大型车辆数据集包含从DOTA数据集中提取的大型车辆图像。在RSOC大型车辆数据集中的172张图像中,有108张用于训练,剩余的64张用于测试。
  3. DroneCrowd数据集:DroneCrowd数据集是一个大规模的无人机数据集。研究人员可以利用DroneCrowd数据集来研究烟雾检测、目标定位、计数和跟踪等任务。在这篇文章中,我们使用了24600张无人机视角的图像进行训练,以及9000张图像进行测试。

Part04实验结果

整体结果

如表1所示,BDRNet在七个具有显著场景变化的数据集上进行了性能验证,并与近年来的先进算法进行了比较分析。BDRNet在RSOC Building数据集上取得了最佳结果,并在RSOC Ship数据集上表现出对密集分布目标位置预测的优势。

表1 RSOC 数据集上BDRNet 在不同算法上的比较结果

表1

消融实验

如表Ⅱ所示,文中测试了不同的模块来分析它们对BDRNet最终性能的贡献,特别强调了AKWA和PwOE模块的有效性。具体来说,BDRNet被分解为三个部分:基线、AKWA和PwOE。基于此,在PUCPR数据集上进行了实验,如表Ⅲ所示。结果表明,PwOE和AKWA模块都有助于提高基线算法的性能。这强调了自适应感受野加权和位置编码先验的重要性。此外,最终结果表明,AKWA和PwOE的结合使网络能够同时考虑位置信息和适当的感受野,以识别遥感图像中的密集目标。

表2 消融实验结果

表2

研究展望

文章强调了密集小目标的有效识别和高斯卷积核函数回归边缘位置的困难,并且为了应对这些挑战设计了BDRNet,它同时解决了选择不同感受野和精确定位密集目标的问题。为验证算法的有效性,在不同的数据集上进行了广泛实验。仿真验证了所提方法的正确性和有效性.与其他计数方法相比,BDRNet在结构设计上保持了网络的自适应性,实现了高斯核函数的精确回归。此外,BDRNet的逐像素预测分支可为对象提供实例级定位,从而提供比其他算法更大的实用性。在不同数据集上的实验结果表明,该方法可以获得更好的计数结果,但与其他简单算法相比,BDRNet算法可能需要更高的计算资源。因此,改善计算资源和计算精度之间的平衡将会是一个重要的研究方向。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值