20、图像增强、分割与高效数据处理

图像增强、分割与高效数据处理

1. 图像分割算法

在图像分割领域,有多种算法可以将类掩码进一步分割为实例。其中,分水岭变换(Watershed transforms)是一类常见的算法。这类算法将单通道张量视为地形表面,每个值代表一个海拔高度,通过特定方法提取代表实例边界的山脊顶部。

有多种实现分水岭变换的方法,部分基于卷积神经网络(CNN)。例如,多伦多大学的Min Bai和Raquel Urtasun提出的用于实例分割的深度分水岭变换(Deep watershed transform),该网络受全卷积网络(FCN)架构启发,输入为预测的语义掩码和原始RGB图像,输出可用于识别山脊的能量图。借助RGB信息,此方法能以较高精度分离重叠实例。

另一种解决实例分割的途径是从目标检测的角度出发。通过以下两个步骤可实现实例分割:
1. 使用目标检测模型为每个目标类别的实例返回边界框。
2. 将每个图像块输入语义分割模型以获取实例掩码。

若预测的边界框准确(每个框捕获一个完整的单一元素),则分割网络的任务就变得简单,即对相应图像块中的像素进行分类,判断哪些像素属于捕获的类别,哪些属于背景或其他类别。

2. Mask R - CNN模型

为了更高效地实现实例分割,Kaiming He等人在2017年提出了Mask R - CNN,它基于Faster R - CNN进行扩展。

Faster R - CNN由区域建议网络(Region - Proposal Network)以及预测每个建议区域的类别和框偏移的两个分支组成。而Mask R - CNN在此基础上增加了一个并行分支,用于输出每个区域中

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值