LaneNet网络主要分成两部分:①车道线边缘提取(像素级别的车道线分类) ② 车道线定位
车道线边缘提取(编码部分):
-
对输入图片上的每个像素进行二进制分类,而并非对车道线进行手工标注
-
采用轻量级的编码——解码的网络结构:编码部分采用深度可分离卷积(3,3)+空洞卷积(扩大图片的感受野)+1*1卷积进行分层特征提取——>无参数解码层恢复feature map的大小(子像素卷积层)
-
有效减少维度的方法:把车道线边缘的映射图转化成车道线边缘点的坐标
-
LaneNet 的图片输入并未做任何预处理,只做了逆透视变换(IPM)
-
网络结构图:
车道线定位(解码部分): -
结构图:
-
使用sub-pixel convolution layers恢复feature map的大小
sub-pixel convolution layers(子像素卷积),又叫做pixel shuffle,是一种图像和特征图upscale的方法。放大特征图的常见方法有直接上采样,双线性插值,反卷积等。sub-pixel是一种在超分辨率中经常使用的upscale方法。