图像增强、分割与高效数据处理
1. 图像分割算法
1.1 分水岭变换
分水岭变换是一类常见的算法,用于将类别掩码进一步分割为实例。该算法将单通道张量视为地形表面,每个值代表一个海拔高度,通过特定方法提取代表实例边界的山脊顶部。有多种实现方式,一些基于卷积神经网络(CNN),例如多伦多大学的 Min Bai 和 Raquel Urtasun 提出的用于实例分割的深度分水岭变换。该网络受全卷积网络(FCN)架构启发,输入为预测的语义掩码和原始 RGB 图像,输出可用于识别山脊的能量图,能以较高精度分离重叠实例。
1.2 从目标检测到实例分割 - Mask R - CNN
另一种解决实例分割的方法是从目标检测的角度出发。具体步骤如下:
1. 使用目标检测模型为每个目标类别的实例返回边界框。
2. 将每个图像块输入到语义分割模型中以获取实例掩码。
如果预测的边界框准确,分割网络的任务就是对相应图像块中的像素进行分类,判断哪些像素属于捕获的类别,哪些属于背景或其他类别。这种方法的优势在于我们已有实现所需的工具(目标检测和语义分割模型)。
1.3 基于 Faster - RCNN 构建实例分割模型
虽然可以简单地使用预训练的检测网络和预训练的分割网络,但将两个网络拼接并进行端到端训练效果会更好。通过公共层反向传播分割损失,能确保提取的特征对检测和分割任务都有意义,这也是 2017 年 Facebook AI Research 的 Kaiming He 等人提出 Mask R - CNN 的初衷。
Mask R - CNN 主要基于 Faster R - CNN,
超级会员免费看
订阅专栏 解锁全文
18万+

被折叠的 条评论
为什么被折叠?



