本博客内容来自于论文:https://arxiv.org/pdf/1904.06493.pdf
论文收录于CVPR2020
论文内容
论文的主要内容是探究了目前目标检测网络中两种主流的Head结构:fully connected head(fc-head)、convolution head(conv-head)。实验证明了使用fc-head更具有空间敏感性,有利于分类任务,而conv-head更加有利于对目标框进行回归的定位任务,作者根据这个结论提出了结合两种形式执行分类和回归任务的Double-head结构,并进行了一系列实验证明了其有效性。
下图是几种head结构:

实现细节
fc-head部分如上图中所示,由两个全连接层组成,参数量13.25M。conv-head部分由下面几个结构组成,其中(a)部分为fc-head结构第一个残差块,用于将提取的RoI的通道数进行升维,参数量1.06M;(b)部分就是fc-head结构后续的残差块参数量1.06M;(c)部分是一个非局部块,加在(b)结构之前,以增强前景目标,参数量2M。作者实验权衡精确度和速度选择由1个(a),2个(b),2个(c)顺序叠加 { a − c − b − c − b } \{a-c-b-c-b\} { a−c−b−c−b}构成conv-head。

网络损失函数如下所示:
L = α f c L f c + α c o n v L c o n v + L r p n L=\alpha^{fc}L^{fc}+\alpha^{conv}L^{conv}+L^{rpn} L=αfcLfc+αconvL