【语义分割】Deeplabv3源码解读

最新推荐文章于 2024-11-30 01:00:00 发布

aaon22357

最新推荐文章于 2024-11-30 01:00:00 发布

阅读量4.1k

点赞数 5

CC 4.0 BY-SA版权

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/aaon22357/article/details/94619101

文章目录

预备知识
ResNet50
Deeplabv3原理分析

最近在做的一个比赛，用到了Deeplabv3，顺便看了一下源码，记录一下。

预备知识

本文提到的output_stride来源于deeplabv3论文，指的是(输入图像的分辨率/特征图的分辨率），可以看出，output_stride越大，说明特征图越小，越高层。

ResNet50

ResNet50包括一个Init Block和四个stage，以及最后的Avgpool和fc。下采样了32倍。（一般的分类网络都是下采样32倍）

1. Init Block

由1个7×7的卷积层+一个maxpooling层组成，其中卷积层的stride为2，max pooling的stride=2，因此经过Init block后的输出尺寸降了4倍。 Init Block输出为64通道。

2. stage1-4

stage1-4的残差块个数依次为[3,4,6,4]

stage1
stage1由三个unit（残差单元）构成，都是1×1或3×3的小卷积，且stride都为1，因此经过stage1后的输出尺寸相对于原图还是降了4倍（与Init block的输出尺寸相同），stage1输出为256通道。
stage2
stage2由四个unit组成，其中unit1的3×3卷积核stride为2，因此，经过stage2后的输出尺寸相对于原图降了8倍，stage2输出为512通道。
stage3
stage3由六个unit组成，其中unit1的3×3卷积核stride为

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。