代码的整体结构及每部分含义网络上已有很多资料,这里不再赘述。但网上很少见到对mmdetection代码设计模式的讲解,所以记录一下自己的理解,及快速修改代码的方式吧(以faster-rcnn为例)。
为了更简单的理解mmdetection的设计,我打算从修改rpn proposal的采样代码说起。rpn proposal的采样目的是在一堆anchor中选择其中一部分,作为proposal,在rpn网络中用于回归bbox及正负例的分类。因此先看rpn在整个faster-rcnn流程中所处的位置:它在mmdet->models->detectors->two_stage.py中。
图1
two_stage.py代表的并不是faster-rcnn,而是一个二阶段网络的训练框架。这个二阶段网络可以是cascade_rcnn,double_head_rcnn等,由于它们都是二阶段网络,因此把它们共性的部分抽取出来,写成了two_stage.py这个文件,当具体到要使用faster-rcnn时,再对two_stage.py加上faster-rcnn的配置。增加方法是在配置文件faster_rcnn_r50_fpn_1x_lvis.py(以下简称cfg文件)中,model的type设置为’FasterRCNN’。但是这个设置是怎么起作用的呢?
先看mmdet->models->detectors->faster_rcnn.py的头文件: