RFCN是基于Faster RCNN的工作,base net得到feature maps, 用RPN得到proposals。由于classification需要固定长度的feature vector,就需要ROI pooling layer + fully connected layer来获得,但是这个过程会去除目标的位置信息,而这个信息对于检测问题,至关重要。所以,RFCN提出position-sensitive score maps来解决这个问题。
position-sensitive ROI pooling layer的输入是ROI features, 输出是C+1维的特征向量。