paper:2307.11960 (arxiv.org)
摘要。三维医学图像的体积标记是专业要求和耗时的;因此,半监督学习(SSL)非常适合使用有限的标记数据进行训练。不平衡的类分布是一个严重的问题,它阻碍了这些方法在现实世界中的应用,但并没有得到太多的解决。为了解决这一问题,我们提出了一种新的双去偏异构协同训练(DHC)框架,用于半监督三维医学图像分割。具体来说,我们提出了两种损失加权策略,即分布感知的去偏见加权(DistDW)和困难感知的去偏见加权(DiffDW),它们动态地利用伪标签来指导模型解决数据和学习偏差。通过共同训练这两个不同且准确的子模型,该框架得到了显著改进。我们还引入了更多具有代表性的类不平衡半监督医学图像分割基准,充分证明了类不平衡设计的有效性。实验表明,我们提出的框架通过使用伪标签来消除和缓解类不平衡问题,取得了显著的改进。更重要的是,我们的方法优于最先进的SSL方法,展示了我们的框架在更具挑战性的SSL设置方面的潜力。关键字:半监督学习·类失衡·三维医学图像分割·CT图像
1 Introduction 介绍
缺乏标记数据是医学图像分割的一个重大挑战,因为获取大量的标记数据是昂贵的,并且需要专业知识。这种不足限制了现有分割模型的性能。为了解决这个问题,研究人员提出了各种半监督学习(SSL)技术,这些技术结合了标记和未标记的数据来训练自然图像[14,13,4,17,16,2]和医学图像[22,12,15,19,11,21,20]的模型。然而,这些方法大多没有考虑到类不平衡问题,这是常见的医学图像数据集。如CT多器官分割需要分割食道、右肾上腺、左肾上腺等,其中类比相当不平衡;见图1(a)。对于CT扫描的肝脏肿瘤分割,通常肝脏与肿瘤的比例大于16:1。
图1:(a) Synapse数据集中前景类的分布。(b)比较每个类别的拟议DistDW的比例排名和Dice值。(c)每一类的体素数和Dice值的比较,x轴的值为DiffDW和DistDW模型的Dice值之差。