PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers(PIDNet:一个由PID控制器启发的实时语义分割网络)
论文地址:chrome-extension://bocbaocobfecmglnmeaeppambideimao/pdf/viewer.html?file=https%3A%2F%2Farxiv.org%2Fpdf%2F2206.02066.pdf
摘要
双分支网络结构在实时语义分割任务中显示了其高效和有效性。然而,直接融合高分辨率细节和低频上下文的缺点是细节特征容易被周围的上下文信息淹没。这种超调现象限制了现有双分支模型分割精度的提高。在本文中,我们在卷积神经网络(CNN)和比例积分导数(PID)控制器之间建立了联系,并揭示了两分支网络等效于比例积分(PI)控制器,其固有地存在类似的超调问题。为了解决这个问题,我们提出了一种新的三分支网络架构:PIDNet,它包含三个分支来分别解析细节、上下文和边界信息,并利用边界关注来指导细节和上下文分支的融合。我们的PIDNets家族实现了推理速度和精度之间的最佳权衡,其精度超过了在cityscape和CamVid数据集上具有相似推理速度的所有现有模型。具体来说,PIDNet-S在cityscape上达到78.6% mIOU,推理速度为93.2 FPS;在CamVid上达到80.1% mIOU,推理速度为153.7 FPS。
本文的主要贡献有三个方面:
- 我们在深度CNN和PID控制器之间建立了联系,并提出了一组基于PID控制器架构的三分支网络。
- 提出了高效模块,如Bag融合模块,旨在平衡细节和上下文特征,以提高PIDNets的性能。
- PIDNet在所有现有模型中实现了推理速度和准确性之间的最佳权衡。
模块
本文的主要模块:Pag:选择性地学习高级语义。