图像增强与分割技术详解
1. 图像超分辨率训练技巧
在训练超分辨率网络时,可采用一个简单技巧:在将图像输入模型之前,使用传统的上采样方法(如双线性插值)将图像缩放至目标尺寸。这样,网络可作为去噪自编码器进行训练,其任务是消除上采样伪影并恢复丢失的细节。示例伪代码如下:
x_noisy = bilinear_upscale(bilinear_downscale(x_train))
fcn_8s.fit(x_noisy, x_train)
相关的完整代码和图像演示可在相关笔记中找到。
2. 语义分割概述
语义分割是将图像分割成有意义部分的通用术语,涵盖了对象分割和实例分割。与图像分类和目标检测不同,分割任务要求方法返回像素级的密集预测,即为输入图像中的每个像素分配一个标签。
3. 编码器 - 解码器用于对象分割
3.1 基本原理
编码 - 解码网络可将数据样本从一个域映射到另一个域,对象分割可看作是将图像从颜色域映射到类别域的操作,即为图片的每个像素分配一个目标类别,返回具有相同高度和宽度的标签图。
3.2 解码为标签图
直接构建编码器 - 解码器输出标签图(每个像素值代表一个类别)效果不佳。对于图像分类,网络最后一层输出 N 个对数几率(logits),代表预测的每个类别的分数,通过 softmax 操作将这些分数转换为概率,再使用 argmax 选择最可能的类别。在语义分割中,可在像素级别应用相同机制,网络返回一个 H × W × N 的张量,其中
超级会员免费看
订阅专栏 解锁全文
255

被折叠的 条评论
为什么被折叠?



