博客
IOU和分类得分之间没有明显的正相关,但是IOU和回归得分之间有明显的正相关。
用分类的得分作为依据判断一个预测框是否准确预测对groundtruth来说是不合理的。
网络架构
IOUNet使用ResNet-FPN作为骨干网络,ROIPooling层则被Precise ROIPooling层所取代,IOU预测器与RCNN分支基于同一骨干网络提取出的特征并行工作,(RCNN分支包括分类分支和bbox回归分支)
initialize weights :在ImageNet上预训练的ResNet模型。new layer用标准差0.01或0.001的zero-mean Gaussian初始化。用smooth-L1。训练数据生成如3.1所示。输入图像大小长最大1200px,宽800px。
分类和回归分支 对每张来自RPN的图片采用512个ROIs,训练batch size 16。
inference阶段,对初始坐标应用边界框回归,所有bbox应用IOU-guided NMS,前100个最高分类分数的bbox将会使用optimization-based的算法refined。
IoU-Net can be end-to-end optimized in parallel with object detection frameworks