语义分割之deeplab v3+

概述

deeplab v3+是deeplab系列中最新内容,也是当前最流行的语义分割算法,本篇文章主要记录的是个人在学习deeplab v3+过程中的一些收获以及个人对该算法的理解。

首先我们先简单回顾下deeplap v3 相关的创新点以及不足。在上一讲的时候我们讲到v3相比v2创新点主要有四个方面,首先它提出了更加通用的框架,其次重新设计了空洞卷积,将空洞卷积和级联模块结合起来使用,而不再单独使用。第三点它改进了ASPP,在ASPP的最后一层使用了BN层。最后一点是去掉了CRF。并且我们在最后,也说了deeplab v3的不足点—就是v3获取处理结果的时候直接按照8或者16进行上采样来获取最终结果,这样处理很粗糙。因为,直接按照8或16的采样率进行上采样的操作并不能充分恢复降采样的过程中损失的细节信息,会导致分割不精确的情况发生。因此v3+的创新点之一就是在在v3的基础上加入编码器和解码器结构来恢复原始分辨率的分割结果,使得边缘细节信息能够较好的保留。同时另一个创新点是将v3的基础网络ResNet101换成了Xception网络,使用深度分割卷积进一步提高分割算法的速度和精度。

算法

image-20200729174012658

首先我们看到左边这张图是是我们之前常见的空间金字塔池化结构,也就是我们之前v2和v3中用的结构,它通过在不同分辨率上的池化操作来捕获丰富的上下文信息。而中间这张图片是FCN算法中用的网络结构,我们称为编码器-解码器结构。在这个结构中编码器一般采用图像分类预训练得到的网络,采用不断的池化和跨步卷积(strided convolution)能够获得长范围的语境信息,从而得到更好的分类结果。然而在此过程中特征分辨率不断降低,图像细节信息丢失,这对于分割任务而言影响很大。因此在编码器之后需要利用解码器进行图像分辨率的恢复。值得注意的一点:一般解码器常常具有类似skip的结构将编码器得到的细节信息加入后续解码

### DeepLabV3+ 模型精度评估指标 DeepLabV3+模型在多个标准数据集上展示了卓越的性能,特别是在PASCAL VOC 2012和Cityscapes数据集上。对于这些数据集,常用的精度评估指标主要包括交并比(Intersection over Union, IoU)、平均交并比(Mean Intersection over Union, mIoU),以及像素准确率(Pixel Accuracy)。具体表现如下: #### 1. 平均交并比 (mIoU) 这是衡量语义分割任务中最常用的一个评价标准之一。它计算的是预测结果与真实标签之间的重叠区域占两者总和的比例,再取各类别的平均值。DeepLabV3+在这项指标上有出色的表现,在PASCAL VOC 2012测试集中达到了89.0%的mIoU得分[^2]。 #### 2. 像素准确率 (Pixel Accuracy) 此指标表示被正确分类的像素数占全部像素总数的比例。虽然这是一个直观易懂的测量方法,但在多类别不平衡的情况下可能不够全面。尽管如此,高像素准确率仍然是模型良好泛化能力的一种体现。 #### 3. 类别平衡下的加权交并比 (Weighted IoU) 考虑到不同类别的样本数量可能存在较大差异,因此引入了权重因子来调整各个类别的贡献度,使得最终的结果更加公平合理。这种方法能够更好地反映模型对稀有类别的识别效果。 为了验证上述提到的各项性能指标,可以通过开源库如`torchmetrics`中的相应函数来进行快速便捷地计算。下面给出一段简单的Python代码片段展示如何利用该库完成这一操作: ```python import torch from torchmetrics import JaccardIndex, Accuracy # 初始化度量工具 iou_metric = JaccardIndex(task="multiclass", num_classes=NUM_CLASSES) accuracy_metric = Accuracy(task="multiclass", num_classes=NUM_CLASSES) # 计算IoU和Accuracy iou_value = iou_metric(preds, target).item() pixel_accuracy = accuracy_metric(preds, target).item() print(f"IOU Score: {iou_value:.4f}") print(f"Pixel Accuracy: {pixel_accuracy:.4f}") ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值