SegNet-论文笔记-理解

SegNet是一种用于像素级语义分割的深度卷积编码-解码架构。它利用VGG16的前13层作为编码器,并针对每个编码器层都有对应的解码器层。通过仅保存最大池化的索引来提高边界细节的精确度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文:SegNet: A Deep Convolutional Encoder-Decoder Architecture for Robust
Semantic Pixel-Wise Labelling

翻译:http://blog.youkuaiyun.com/u014451076/article/details/70741629

理解参考:http://blog.youkuaiyun.com/fate_fjh/article/details/53467948

Demo:http://mi.eng.cam.ac.uk/projects/segnet/

核心技术:
总体结构:
这里写图片描述
感觉其实和FCN思路十分相似,只是Encoder,Decoder(Upsampling)使用的技术不一致.此外SegNet的编码器部分使用的是VGG16的前13层卷积网络,每个编码器层都对应一个解码器层,最终解码器的输出被送入soft-max分类器以独立的为每个像素产生类概率.
每个编码器由数个蓝色层(卷积层,批归一化层,RELU层)以及一个Pooling层(2x2窗口,步进2,最大池化)组成,输出相当于系数为2的下采样.由于最大池化和子采样的叠加,导致边界细节损失增大,因此必须在编码特征图中在sub-sampling之前捕获和储存边界信息.为了高效,文中只储存了max-pooling indices.

突出贡献:
分割的精度略好于FCN,总体效率也比FCN略高,

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值