论文地址:https://arxiv.org/abs/1506.01497 代码地址:https://github.com/rbgirshick/py-faster-rcnn Faster RCNN的结构如下: 一张图像作为输入,通过CNN提取特征,得到feature map; 将feature map输入到RPN层,RPN层原理如下,用一个3x3的滑动窗,遍历整个feature map,在遍历的过程中每个窗口的中心按照1:1,1:2,2:1的比例生成9个anchor box,然后利用FC层对anchors做二分类和粗略的边框回归,最后输出比较精确的300个R