期刊:2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)
源码链接:https://github.com/DeepMed-Lab-ECNU/BCPz
目录
1. Background
医学图像分割对于许多临床应用至关重要,例如肿瘤检测和器官识别。然而,手动标注医学图像不仅耗时且昂贵,这使得在实际应用中难以获得大量的标记数据。为了解决这个问题,半监督学习方法在医学图像分析领域中变得越来越流行,这些方法利用少量的标记数据和大量的未标记数据进行学习。
现有的半监督方法通常会将标记和未标记数据分开分别用于学习。这种做法存在明显的问题。例如,一组高质量的MRI图像中标注了肿瘤的位置,这是标记数据。与此同时,还存在大量低质量的CT图像,这些图像没有任何标注,是未标记数据。因此,由于标记数据和未标记数据的来源和质量不同,它们的分布可能不匹配。如果分别处理这些标记和未标记数据,模型可能会忽略从高质量MRI图像中学到的重要知识,无法有效应用到低质量CT图像上。这种处理方式导致标记数据中的大量知识被丢弃,同时也加剧了标记和未标记数据之间的经验分布不匹配问题。
2. Motivation
CutMix是一种简单但强大的数据增强方法,又称为复制黏贴(CP)。这种方法有助于未标注的数据从标注数据中学习常见的语义,因为同一图像中的像素共享更接近的语义。在半监督学习中,通常会对未标注数据进行弱增强和强增强,并强制它们之间保持一致性,CP常被用作强增强手段。然而,现有的CP方法存在一些不足:
-
处理较差的未标注数据:现有方法没有很好地处理未标注数据,或者只是简单地将标注数据中的物体复制为前景并粘贴到另一个数据中。
-
忽略一致的学习策略:这些方法没有为标注数据和未标注数据设计一致的学习策略,这阻碍了它们在减少分布差距方面的效果。
-
伪标签的局限性:CP方法试图通过增加未标注数据的多样性来增强网络的泛化能力,但由于CutMix图像仅依赖于低精度的伪标签进行监督,因此难以实现高性能。
为了缓解标注数据和未标注数据之间的经验分布不匹配问题,本文提出了一种成功的设计,旨在鼓励未标注数据从标注数据中学习全面的公共语义,同时通过对标注数据和未标注数据采用一致的学习策略来促进分布对齐。也就是提出了一种简单但非常有效的双向复制黏贴(BCP)方法,并在Mean Teacher框架中实现。