Lightweight and Progressively-Scalable Networks for Semantic Segmentation简记-优快云博客

文章介绍了LPS-Net，这是一种针对准确率和速度平衡的轻量网络架构。它采用多路处理不同尺度的输入图像，并通过路径交互方法提高性能。网络结构包含固定数量的卷积块和交互路径，卷积块设计为包括3x3卷积、BN和ReLU层。实验部分展示了LPS-Net在Cityscapes、BDD100K和CamVid等数据集上的效果，并与其他方法进行了比较，证明了其在嵌入式设备上的实用性。

1.介绍

贡献：可行的轻量网络设计和路径交互方法，扩展到所需准确率和速度平衡的方法
https://github.com/YihengZhang-CV/LPS-Net

2.相关工作

3.LPS-Net

3.1 宏观结构

多路处理输入图像的不同尺度，每路的网络结构相同
每路有5组stage。
- 1到4组的第一个卷积步长是2，其他是1。
- 3到5组后路径交互，看代码第五组后是torch.cat
每组的通道数相同，有若干卷积块

3.2 卷积块

类型：标准卷积，FLOPs忽略了命中内存的代价，使用FLOPs-efficiency更合理，需要实际运行确定
通道数：2^n的倍数，n越大越好
一个卷积块包括3*3的卷积层，BN层和ReLU层，预测时没有BN层

3.3 路径交互

直接采样相加最高效

3.4 可扩展结构

参数
- B：每组stage的卷积块数（深度，高级语意）
- C：通道数（宽度，卷积的学习能力）
- R：输入放缩比例
从B0 = {1, 1, 1, 1, 1}, C0 = {4, 8, 16, 32, 32}, R0 = {1/2, 0, 0}开始

4.实验

4.1 数据库：Cityscapes, BDD100K， CamVid

4.2 细节

PyTorch
SGD
cross-entropy loss
momentum 0.9
weight decay 0.0005
“Poly” policy with power 0.9 is adopted with initial learning rate 0.01（Cityscapes）
crop，color-jittering, random horizontal flip and random scaling (0.5× ∼ 2.0×)
Model re-parameterization