1.介绍
- 贡献:可行的轻量网络设计和路径交互方法,扩展到所需准确率和速度平衡的方法
- https://github.com/YihengZhang-CV/LPS-Net
2.相关工作
3.LPS-Net
3.1 宏观结构
- 多路处理输入图像的不同尺度,每路的网络结构相同
- 每路有5组stage。
- 1到4组的第一个卷积步长是2,其他是1。
- 3到5组后路径交互,看代码第五组后是torch.cat
- 每组的通道数相同,有若干卷积块
3.2 卷积块
- 类型:标准卷积,FLOPs忽略了命中内存的代价,使用FLOPs-efficiency更合理,需要实际运行确定
- 通道数:2^n的倍数,n越大越好
- 一个卷积块包括3*3的卷积层,BN层和ReLU层,预测时没有BN层
3.3 路径交互
- 直接采样相加最高效
3.4 可扩展结构
- 参数
- B:每组stage的卷积块数(深度,高级语意)
- C:通道数(宽度,卷积的学习能力)
- R:输入放缩比例
- 从B0 = {1, 1, 1, 1, 1}, C0 = {4, 8, 16, 32, 32}, R0 = {1/2, 0, 0}开始
4.实验
4.1 数据库:Cityscapes, BDD100K, CamVid
4.2 细节
- PyTorch
- SGD
- cross-entropy loss
- momentum 0.9
- weight decay 0.0005
- “Poly” policy with power 0.9 is adopted with initial learning rate 0.01(Cityscapes)
- crop,color-jittering, random horizontal flip and random scaling (0.5× ∼ 2.0×)
- Model re-parameterization
4.3 评估轻量设计:卷积块和交互方式
4.4 评估逐步扩展
- 得到LPS-Net-S, LPSNet-M, and LPS-Net-L,都是两路
- M比S提高了输入大小
- L比M提高了通道数