- https://blog.youkuaiyun.com/qq_36449741/article/details/107514006
- https://arxiv.org/abs/1912.00969
定向框的表示
一步网络结构
大多数遥感影像数据集都缺乏精度和数量。将backbone在ImageNet上进行预训练,并在目标数据集中进行微调,例如DOTA和HRSC2016。这样,网络能够从遥感图像中提取更精细的特征。
在一般数情况下,一步网络的分类层、回归层对于角度的回归没有很多的关系,因此作者需要在分类层中添加了一个新层或者在回归层进行回归,二维向量进一步表示为[w,h],这也是表示目标方向的参数。此外,还分别使用两个卷积层来预测[w,h]参数。将此分支称为方向分支,这是head上的第三个分支。此head设计为:
在上图中,作者使用IE模块从其他分支提取特征,并将其组合到方向特征,以生成最终特征以进行方向回归。
自监督IE模块
为了提供更多的特征并提高定向预测的准确性,作者使用自注意模块构建了一个相互作用的分支,以获取来自分类和检测框回归分支的特征,这些特征可能会通过自注意机制进行重新安排。自注意可以建立这些特征图之间的关系,并确定哪个特征更适合定向回归。这些特征将与注意相结合,然后添加到定向分支中,如下图所示。
损失函数