一、U-Net简介
U-Net 是最初为医学影像分割而提出的一种语义分割技术。 它是较早的深度学习分割模型之一,U-Net 架构也用于许多 GAN 变体,例如 Pix2Pix 生成器。
U-Net 在论文 U-Net: Convolutional Networks for Biomedical Image Segmentation 中进行了介绍。 模型架构相当简单:一个编码器(用于下采样)和一个解码器(用于上采样),带有跳跃连接。 如图 1 所示,它的形状像字母 U,因此得名 U-Net。
二、数据集说明
我们将使用作为 TensorFlow 数据集 (TFDS) 的一部分提供的 Oxford-IIIT 宠物数据集。 它可以很容易地用 TFDS 加载,然后进行一些数据预处理,为训练分割模型做好准备。
可以使用 tfds 通过指定数据集的名称来加载数据集,并通过设置 with_info=True 来获取数据集信息: