语义分割技术全解析:从基础概念到先进网络
1. 语义分割概述
语义分割的任务是将图像中的每个像素分配到一个对象类别,通过将特定类型对象的所有像素涂成相同颜色来实现。例如,输入一张包含两只猫和一只狗的图像,输出图像中两只猫的像素为黄色,狗的像素为红色,地面像素为绿色,天空像素为蓝色。该任务的一个关键特性是输出的宽度和高度维度与输入相同,但输入和输出的通道数不同。通常输入有三个通道(RGB),输出的通道数与类别数相同。
简单语义分割网络
简单的语义分割网络由卷积网络组成,没有池化层,所有层的步长为 1。随着网络深入,通道数增加,输出层的通道数与要分类的对象类型总数相同。如果对每一层的边界进行适当填充,输出层将具有正确的尺寸。然而,这种网络没有池化层或大的卷积步长,效率较低。因为网络深层的层不仅通道多,而且宽度和高度也大,导致网络中每一层的值(特征)总数增加。而在典型的 CNN 中,随着网络深入,宽度和高度会减小,从而使特征总数减少或保持不变。
为了在语义分割中使用更传统的 CNN(网络内部分辨率降低),需要在最终层再次提高分辨率,以得到具有正确尺寸的输出层。
2. 上采样技术
提高图像分辨率称为上采样,有多种方法,下面介绍两种常见技术:
2.1 最近邻插值
最近邻插值是一种简单的上采样方法。以将 3×3 图像上采样为 6×6 图像为例,上采样后的每个像素直接采用最接近的原始像素的值。也就是说,每四个上采样像素将采用位于其中心的原始像素的相同颜色。因此,即使结果图像有 36 个像素,其独特颜色也不会超过 9 种,这会导致上采样图像出现像素化外观。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



