DeepLab 是 Google Research 提出的 语义分割(Semantic Segmentation) 系列模型,从 2015 年的 DeepLabv1 到 2018 年的 DeepLabv3+,逐步优化了分割精度、计算效率和边界细节。以下是其核心版本的演进及关键技术:
1. DeepLabv1 (2015)
核心创新:空洞卷积(Atrous Convolution)
-
问题:传统 CNN 通过池化(Pooling)降低分辨率,导致空间信息丢失。
-
解决方案:使用 空洞卷积(Dilated Convolution) 在不减少分辨率的情况下扩大感受野。
-
架构:基于 VGG16,后接 CRF(条件随机场)优化边界。
-
局限:CRF 计算成本高,且仅依赖单一尺度的特征。
贡献:首次将空洞卷积引入语义分割,减少信息损失。
2. DeepLabv2 (2016)
核心创新:ASPP(空洞空间金字塔池化)
-
问题:物体尺寸变化大,单一感受野难以适应不同尺度。
-
解决方案:提出 ASPP(Atrous Spatial Pyramid Pooling),

最低0.47元/天 解锁文章
1142

被折叠的 条评论
为什么被折叠?



