Rethinking BiSeNet For Real-time Semantic Segmentation
摘要
BiSeNet已经被证明是一种流行的实时分割的双流网络。然而,其增加额外路径来编码空间信息的原理是耗时的,并且从预训练的任务(例如图像分类)中借用的骨干网可能由于特定任务设计的不足而不能有效地用于图像分割。为此,提出Short-Term Dense Concatenatenetwork(STDC Network)。具体地说,我们逐步降低了特征图的维数,并将特征图的聚合用于图像表示,构成了STDC网络的基本模块。在解码器中,我们提出了一个Detail Aggregation module细节聚合模块,将学习的空间信息以单流的方式整合到低层。最后,融合低层特征和深层特征对最终的分割结果进行预测。
引言
DFANet [18] and BiSeNetV1把轻量化网络作为骨干网,由于特定任务设计的不足,这些从图像分类任务中引用来的轻量化网络可能不能很好地解决图像分割问题。另一种常用提高推理速度方法是限制输入图像大小,但容易忽略边界和小对象周围的详细外观,为此,bisenet把低层细节和高层语义相结合得到多分支网络,但是增加一个额外路径获取低层特征非常耗时,辅助路径往往缺乏底层信息引导。
our,STDC模块由多个感受野特征构成且参数量少----将多个连续的层的响应特征进行拼接操作,为了加速,逐步减小卷积核的大小。通过U型结构构成STDC网络。解码端,细节引导模块引导低层细节,首先,用 Detail Aggregation module细节聚合模块得到细节GT,然后,用损失函数优化细节信息。最后将来自低层的细节信息和来自深层的语义信息进行融合,预测结果。
贡献:STDC模块, Detail Aggregation模块
相关工作
实时语义分割,两类主流方法实现高效分割,1,lightweight backbone. DFANet,DFNet;2,multi-branch architecture. ICNet,BiSeNetV1,BiSeNetV2