语义分割-DeepLabv1

最新推荐文章于 2025-10-03 14:18:51 发布

原创

最新推荐文章于 2025-10-03 14:18:51 发布 · 716 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

DeepLabv1是语义图像分割的一种方法，通过改进VGG-16网络，引入空洞卷积（hole算法）和CRF，提高了分割精度。它保留了VGG-16的部分池化层，使用不同膨胀率的空洞卷积扩大感受野，同时结合全连接条件随机场（CRF）优化边界效果，最终实现高质量的分割结果。

DeepLabv1

论文原文

Semantic image segmentation with deep convolutional nets and fully connected CRFs

0. 简介

DeepLabv1针对CNN做语义分割的缺点做了些改进：

将hole算法(即空洞卷积)引入了CNN中；
将CRF与DCNN结合，提升了语义分割的精度；

1. 网络架构

模型图
在这里插入图片描述
VGG-16
Deeplab整体基于VGG-16进行修改：

VGG-16的FC层换成卷积；
最后两个池化层（pool4、pool5）去掉了下采样(padding到原大小)，两个池化层的步长2改成1，下采样32倍变为8倍；
最后三个卷积层（conv5_1、conv5_2、conv5_3）的dilate rate设置为2，且第一个FC层转化后的卷积层的dilate rate设置为4（保持感受野）；
基于预训练的VGG16的权重做fine-tune

训练时，损失函数取是输出的特征图与ground truth下采样8倍做交叉熵和；测试时取输出图双线性上采样8倍得到结果。

2. hole算法（atrous算法）

使用不同采样率的空洞卷积，可以让模型再密集的计算时，明确控制网络的感受野
在这里插入图片描述
卷积
空洞卷积

3. CRF

DCNN的输出是比较平滑的：
在这里插入图片描述
为得到明确的边界预测，可以采用全连接CRF来处理，短范围的CRF或局部CRF都会使得边界更加平滑。

全连接CRF的能量函数，作为训练的损失函数，即最小化E(x)：
在这里插入图片描述
第一项， $p(x_i)$

最低0.47元/天解锁文章

评论 3

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。