【论文笔记】Weakly Supervised Learning Based on Coupled Convolutional Neural Networks for Aircraft Detecti

本文介绍了使用耦合卷积神经网络(Coupled Convolutional Neural Networks, CCNNs)进行飞机检测的弱监督学习方法。CRPNet作为候选区域提议网络,通过预训练、迭代训练和候选区域生成来定位飞机。随后,LOCNet进一步精确定位。该方法在缺乏大量精确边界框标注的情况下,仍能有效检测飞机。" 113513628,10538855,Python Seaborn:数据分布可视化详解,"['Python可视化', '数据可视化', 'Seaborn']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Weakly Supervised Learning Based on Coupled Convolutional Neural Networks for Aircraft Detection

基于耦合卷积神经网络的弱监督学习用于飞机检测

Fan Zhang, Bo Du, Senior Member, IEEE, Liangpei Zhang, Senior Member, IEEE, and Miaozhong Xu
IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTESENSING, VOL. 54, NO. 9, SEPTEMBER201

【abstract】

本文的目标是使用基于耦合卷积神经网络的弱监督学习来进行高分辨率遥感图像(VHR)中的机场检测。
目前已存方法存在一下几个弊端:
(1)难以提取高级特征和分层特征代表;
(2)对大型图像进行人工注释代价昂贵,且不可信;
(3)在大型图像上进行小区域定位非常耗时。

【Overview of The Proposed Method】

论文提出的方法,是基于耦合CNN模型的弱监督学习方法,下面分为三个部分介绍该方法:弱监督、耦合CNN中的CRPNet和LOCNet。

弱监督

弱监督学习同样基于CNN模型,它只需要弱标签,例如图像级标签来作为训练样本。若标签只需说明图像中有无包含目标,并且弱监督可以挖掘相关数据(见下),因此,弱监督学习在训练过程中只需要少量的人工注释工作。

CRPNet(candidate region proposal network)

候选区提议网络,用于进行大尺寸的高分辨率遥感图像(VHR)的特征提取工作,方法如下:

1.预训练

使用辅助数据来进行预训练,辅助数据来自California大学的Merced数据集。该数据集包含21个场景类,每个场景类中包含100个图像样本。
预训练过程中,使用Merced数据集中包含飞机的图片为正样本,不包含飞机的图片为负样本(辅助数据),并将负样本加入训练数据集。

2.迭代训练

对于给定的VHR图像,从中标记飞机作为正样本,使用辅助数据作为负样本进行训练。在每一次迭代过程中,CRPNet产生一张候选区域图,并且从原始图像中自动挖掘负样本组成背景数据集,并更新训练样本集。自动挖掘负样本,指的是在迭代过程中收集背景类中获得高分(可能性大于0.5)的难样本,并添加近负样本当中。难样本(hard example)指的是CRPNet在背景中检测到的包含飞机的区域,但背景中实际上不可能包含飞机,所以将这一类候选区域作为难样本,添加到负样本中。

3.候选区域生成

当CRPNet训练完毕后,我们使用候选区域图来产生用于机场检测的候选区域。
### 数据高效且弱监督的计算病理学方法 在全切片图像(WSI)的计算病理学中,数据高效的弱监督方法旨在减少对大规模标注数据的需求,同时保持较高的预测准确性。这些方法通过引入特定的技术框架来应对WSI特有的挑战。 #### 多实例学习(MIL) 多实例学习是一种有效的弱监督策略,在处理WSI时尤为有用。具体来说,整个幻灯片被划分为多个小区域或“实例”,而每个滑动窗口对应一个包(bag)。对于给定的一组未标记的小图块,如果其中至少有一个属于阳性类别,则该包被认为是阳性的;反之则为阴性[^1]。 ```python def create_bags(slide_image, patch_size=256): """将整张幻灯片分割成固定大小的小图块""" patches = [] width, height = slide_image.size for i in range(0, width-patch_size+1, patch_size//2): # 使用步长patch_size/2实现重叠采样 for j in range(0, height-patch_size+1, patch_size//2): patch = slide_image.crop((i, j, i+patch_size, j+patch_size)) patches.append(patch) return patches ``` 这种方法允许算法仅依赖于幻灯片级别的标签来进行训练,而不是精确到每一个细胞或者组织结构上的细粒度注解。因此大大降低了人工成本,并提高了模型泛化能力。 #### 训练流程优化 为了进一步提高效率并降低资源消耗,研究者们还设计了一套完整的MIL分类管道: 1. 对每轮迭代中的所有样本执行一次前向传播; 2. 根据得到的结果对同一张幻灯片内部的不同实例进行排序; 3. 只选取排名最高的那个作为代表参与反向传播更新参数[^2]。 这种机制不仅简化了传统意义上的逐像素标注过程,而且能够聚焦最具判别力的部分特征,从而提升整体性能表现。 综上所述,针对全切片图像的数据高效且弱监督计算病理学方案主要依靠多实例学习理论以及精心构建的学习架构共同作用下得以实现。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值