基于知识蒸馏的车辆可行驶区域分割算法研究
期刊:汽车技术
时间:2020
研究院:同济大学
关键词:知识蒸馏可行驶区域图像分割卷积神经网络
前言
2014 年 ,Long J[1] 等人提出使用全卷积神经网络 (Fully Convolutional Networks,FCN)对图像进行语义分割,这是卷积神经网络在图像分割领域的首次成功应用
Olaf Ronneberger[2]等人提出一种用于医疗图像分割的 U 形网络 U-net,该方法最大的贡献在于提出了将图像编码与解码进行融合的思想
2018 年,何恺明[3]从另一个角度对图片进行语义分割,提出掩膜区域卷积神经网络(Mask Region-based Convolutional Neural Network, Mask R-CNN)模型
DeepLabV3+分割网络
图 2a 为 DeepLabV3 的空间金字塔池化网络结构,该结构使用串行结构进行编码,将原图压缩为 1/8 的特征图后再使用空间金字塔池化结构丰富特征,然后将 8 倍的上采样映射回原图。这种结构忽略了浅层的特征信息,分割的损失比较大。图 2b 为典型的编码解码结构,可以将浅层信息与深层信息充分融合,但是这种方法使得网络结构更加复杂,难以实现。因此,DeepLabV3+将两者的优点进行结合,提出基于空间金字塔池化的编码解码语义分割网络结构,如图 2c 所示。

本文介绍了一种基于知识蒸馏的车辆可行驶区域分割算法。该算法利用DeepLabV3+网络结构,结合Resnet18作为主干网络,通过空间金字塔池化和编码解码结构来提高分割精度。实验表明,该方法能够有效提升分割效果。
最低0.47元/天 解锁文章
977

被折叠的 条评论
为什么被折叠?



