更多内容更新于个人博客 twn29004.top
论文总结
本文首先提出了一个目前二阶段目标检测网络存在的问题,就是第一阶段提出的proposal通常与真实的边界框存在一定的偏移,特别是在距离较远,包含点很少的目标。例如上图中的(a),©,(d)中提出的proposal.由于偏移的存在,这样的话这些边界框就很难获的目标的边缘信息。此外,现存的refine的网络也没有聚合或者补偿这些边界信息的机制。此外,现存的网络在优化这些proposal的时候,通常是独立的来优化这些proposal,本文中提出了一种将这些proposal建立图神经网络来同时调整以及特征的传播。作者的解释是通过这个图神经网络,使得当前的proposal能够扩大感受野,获得与其相邻的其他proposal的特征,这样的话就能更好的获得目标的边界信息。
此外,由于BEV的表达方式存在着一些问题,比如特征模糊或者放弃了3D结构的上下文信息,因此作者提出了一个新的局部特征聚合的网络来弥补这些损失。
本文中图神经网络的机制:
以两个proposal的中