【论文阅读】火星语义分割的半监督学习

【论文阅读】火星语义分割的半监督学习


S 5Mars: Semi-Supervised Learning for Mars Semantic Segmentation

深度学习已经成为火星探测的有力工具。火星地形语义分割是一项重要的火星视觉任务,是火星车自主规划和安全驾驶的基础。

缺乏足够详细和高置信度的数据注释

从联合数据和方法设计的角度提出了解决方案

提出了一个新的数据集S5Mars
  

用于半监督学习的Mars语义分割,基于置信度进行稀疏注释

提出了一种用于火星图像语义分割的半监督学习(SSL)框架,有限的标记数据中学习表征(就是特征图)

广泛使用的自然图像增强对火星图像的影响

  

组成成分:

  1. 两种新颖有效的火星分割SSL增强和增强实例规范化(AugIN)和SAM-Mix增强
  2. 我们引入了软到硬的一致性学习策略,基于预测置信度从不同的目标学习

  

该方法的性能明显优于现有的SSL算法

  

一、介绍

越来越多的可用数据促进了深度学习算法的应用和发展

本文探讨了火星地形语义分割的任务,该任务旨在从图像中识别出可驾驶区域特定地形

  

火星语义分割面临着数据和方法设计两方面的问题

缺乏令人满意和可用的数据在一定程度上阻碍了深度学习方法的发展

火星漫游者的成本高,带宽有限,从火星到地球的数据传输丢失,收集火星数据非常昂贵。

  

由于地形的复杂性和相似性,精细和密集的像素级标记是高度专业化和耗时的

火星地形分割数据集AI4Mars只定义了4个简单的类别,难以满足复杂地形识别的实际需求
  

火星地形分割任务面临两个主要挑战:

  1. 缺乏足够详细和高置信度注释的数据
  2. 针对火星图像数据的SSL研究不足
      

我们从数据和方法设计两方面解决了上述问题,将其命名为火星半监督语义分割s5mars

为了提高标签的质量,数据集的标注采用稀疏标注的方式,即只标注人类置信度高的区域

  

从这些稀疏数据中学习,我们提出了一种新的火星图像地形分割的半监督框架。

  

基于最近流行的基于一致性正则化的方法,利用弱到强的增广来产生扰动

同时追求扰动的一致性

  

进一步提出了两种新颖有效的增强方法:增强实例规范化AugIN和SAM-Mix

  1. AugIN在图像之间交换统计信息以生成新的数据视图,同时避免剧烈的颜色分布变化
  2. SAM- mix利用预训练的segment-anything模型(SAM)[14]生成高质量的目标蒙版,减少了混合图像的不确定性

  

两种数据的增强使得学习一致性更好,性能显著提高

该策略在低置信度区域使用软伪标签,在高置信度区域使用硬伪标签,充分利用了未标记数据

  

贡献:

  1. 收集了一个新的细粒度标记火星数据集,用于地形语义分割,该数据集包含大量火星地貌数据,数据集由专业团队在多轮检查返工下进行稀疏注释<
### 半监督学习框架在语义分割任务中的应用 #### 应用背景 语义分割作为计算机视觉的重要分支,旨在对图像中的每一个像素进行分类。尽管有监督的深度学习方法已经取得了一定的成功,但是这些方法通常需要大量的带标签数据来进行训练,而获取高质量的逐像素标注非常耗费时间和资源[^1]。 #### 实现方式一:增强技术与一致性正则化 一种有效的方法是在半监督设置下利用未标记的数据来改进模型的表现。例如,在火星语义分割的研究中,研究人员开发了两种创新的技术——增强实例规范化(AugIN)和SAM-Mix增强。这两种技术能够通过对输入图像施加变换并强制网络对于变化后的图像给出一致的结果,以此提升模型鲁棒性和准确性。此外,还采用了软到硬的一致性学习策略,该策略依据预测置信度调整损失函数权重,促进更稳定的学习过程[^3]。 #### 实现方式二:特征重构与跨模态融合 另一种值得注意的方式是由AllSpark提出的解决方案。此方案通过引入信道交叉注意力机制从未标记样本中提取有用的信息,并尝试重建已知类别的特征表示。具体来说,AllSpark不仅增强了未标记数据的作用,而且还确保了其表征能力接近甚至超越原始标记集。这种方法避免了传统两阶段训练模式带来的局限性,即先单独优化带有真实标签的部分再处理无标签部分;相反,它提供了一个更为紧凑高效的单一流程,适用于多种架构下的迁移学习场景[^4]。 ```python import torch.nn as nn class ChannelCrossAttention(nn.Module): def __init__(self, channels): super(ChannelCrossAttention, self).__init__() self.query_conv = nn.Conv2d(channels, channels//8, kernel_size=1) self.key_conv = nn.Conv2d(channels, channels//8, kernel_size=1) self.value_conv = nn.Conv2d(channels, channels, kernel_size=1) def forward(self, x_labeled, x_unlabeled): Q = self.query_conv(x_labeled).permute(0, 2, 3, 1).contiguous().view(-1, (channels//8)) K = self.key_conv(x_unlabeled).permute(0, 2, 3, 1).contiguous().view(-1, (channels//8)).transpose(1, 0) V = self.value_conv(x_unlabeled).permute(0, 2, 3, 1).contiguous().view(-1, channels) attention_weights = F.softmax(torch.matmul(Q, K), dim=-1) attended_features = torch.matmul(attention_weights, V).view(*x_labeled.size()) return attended_features + x_labeled ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值