医学图像语义分割：Unet与Unet++的比较-优快云博客

本文探讨了医学图像语义分割的重要性和常用架构Unet及Unet++。通过对比不同预训练编码器，如VGG11、ResNet34和ResNeSt200e，发现在胸部X光图像分割任务中，Unet++通常表现优于Unet，尤其是ResNeSt200e编码器表现出最佳性能。此外，文章还展示了在更复杂的PanNuke数据集上，Unet++依然保持良好性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

语义分割在生物医学图像分析中有着广泛的应用：x射线、MRI扫描、数字病理、显微镜、内窥镜等。https://grand-challenge.org/challenges上有许多不同的有趣和重要的问题有待探索。

从技术角度来看，如果我们考虑语义分割问题，对于N×M×3(假设我们有一个RGB图像)的图像，我们希望生成对应的映射N×M×k(其中k是类的数量)。有很多架构可以解决这个问题，但在这里我想谈谈两个特定的架构，Unet和Unet++。

有许多关于Unet的评论，它如何永远地改变了这个领域。它是一个统一的非常清晰的架构，由一个编码器和一个解码器组成，前者生成图像的表示，后者使用该表示来构建分割。每个空间分辨率的两个映射连接在一起(灰色箭头)，因此可以将图像的两种不同表示组合在一起。并且它成功了！

在这里插入图片描述
接下来是使用一个训练好的编码器。考虑图像分类的问题，我们试图建立一个图像的特征表示，这样不同的类在该特征空间可以被分开。我们可以(几乎)使用任何CNN，并将其作为一个编码器，从编码器中获取特征，并将其提供给我们的解码器。据我所知，Iglovikov & Shvets 使用了VGG11和resnet34分别为Unet解码器以生成更好的特征和提高其性能。
在这里插入图片描述
Unet++是最近对Unet体系结构的