图像分割中处理前景 - 背景不平衡的损失函数比较分析
1. 引言
在计算机视觉领域,目标检测通常是为图像中的每个类别创建一个边界框,但这种方法仅提供边界框坐标信息,未考虑对象的具体形状。而图像分割则是目标检测的扩展,研究人员通过为图像中的每个对象生成逐像素掩码来标记对象的存在。语义分割将图像划分为具有相似颜色、纹理或属于同一对象属性的区域,相比目标检测,它更具粒度,能帮助我们确定图像中对象的形状。
近年来,前景 - 背景(F - B)不平衡问题引起了计算机视觉研究人员的关注。在 F - B 不平衡问题中,背景类是过度代表的类别,而前景类是代表性不足的类别。当前景对象在图像中所占比例小于背景对象时,就会出现这种问题。例如,在一幅图像中,无人机被分割为前景类(标记为红色),而天空作为背景类(标记为黑色),无人机仅占据整个图像的少数像素,而天空几乎占据了所有比例,这会导致图像分割方法(如流行的 U - Net 深度学习模型)的性能下降。
U - Net 是一种基于卷积神经网络(CNN)的先进语义逐像素分割模型,它利用低分辨率特征将图像像素转换为像素类别,并对彩色输入图像的不同区域进行分类,常用于医学图像分析中的病变分割、解剖分割和分类。F - B 不平衡问题对 U - Net 图像分割模型构成挑战,会导致其性能降低。虽然已经提出了几种损失函数来处理深度学习中的传统类别不平衡问题,但从业者和研究人员对于哪些损失函数在处理现实世界数据集中(如医学成像和遥感)的 F - B 不平衡问题更有效缺乏信心。因此,有必要在 U - Net 深度学习模型中评估各种损失函数,以处理 F - B 不平衡问题。
本文的主要贡献如下:
- 比较使用不同损失函数的多个 U - Ne
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



