图像增强、分割与高效数据处理
1. 图像分割算法
在图像分割领域,有多种算法可以将类掩码进一步分割为实例。其中,分水岭变换(Watershed transforms)是一类常见的算法。这类算法将单通道张量视为地形表面,每个值代表一个海拔高度,通过特定方法提取代表实例边界的山脊顶部。
有多种实现分水岭变换的方法,部分基于卷积神经网络(CNN)。例如,多伦多大学的Min Bai和Raquel Urtasun提出的用于实例分割的深度分水岭变换(Deep watershed transform),该网络受全卷积网络(FCN)架构启发,输入为预测的语义掩码和原始RGB图像,输出可用于识别山脊的能量图。借助RGB信息,此方法能以较高精度分离重叠实例。
另一种解决实例分割的途径是从目标检测的角度出发。通过以下两个步骤可实现实例分割:
1. 使用目标检测模型为每个目标类别的实例返回边界框。
2. 将每个图像块输入语义分割模型以获取实例掩码。
若预测的边界框准确(每个框捕获一个完整的单一元素),则分割网络的任务就变得简单,即对相应图像块中的像素进行分类,判断哪些像素属于捕获的类别,哪些属于背景或其他类别。
2. Mask R - CNN模型
为了更高效地实现实例分割,Kaiming He等人在2017年提出了Mask R - CNN,它基于Faster R - CNN进行扩展。
Faster R - CNN由区域建议网络(Region - Proposal Network)以及预测每个建议区域的类别和框偏移的两个分支组成。而Mask R - CNN在此基础上增加了一个并行分支,用于输出每个区域中
超级会员免费看
订阅专栏 解锁全文
18万+

被折叠的 条评论
为什么被折叠?



