论文原文
SegNet: A Deep ConvolutionalEncoder-Decoder Architecture for ImageSegmentation
0. 简介
SegNet与DeconvNet在结构上非常相似,也都使用了maxpooling的索引来进行上采样,两者主要区别在于:
- SegNet去掉了FC层,而DeconvNet没有;
- SegNet在decoder中使用了卷积,而DeconvNet使用了反卷积;
去掉了FC层,使得SegNet的参数量更小,也更容易实现端到端的训练,同时训练速度和推理速度都很快。
同时SegNet实现了几乎完全对称encoder-decoder结构。
1. 网络架构

和DeconvNet相同,SegNet的encoder部分基于VGG 16,但是没有卷积层,在进行maxpooling时,同时保存pooling的索引,以便decoder进行上采样使用。
SegNet的decoder部分根据encoder的pooling的索引,来进行上采样;同时不同于DeconvNet使用反卷积,SegNet使用了卷积操作。
SegNet的encoder,decoder几乎完全对称,decoder最后接了一层softmax层来进行预测分数。

SegNet是一种深度卷积神经网络,用于图像语义分割。它采用VGG 16作为编码器,并利用maxpooling索引进行上采样,形成对称的编码-解码结构。SegNet的亮点在于没有全连接层,减少了参数数量,易于端到端训练,且在推理速度和内存需求上有优势。实验表明,尽管在某些数据集上的性能可能不如其他模型,但其速度和效率使其成为一个实用的选择。
最低0.47元/天 解锁文章
1054

被折叠的 条评论
为什么被折叠?



