MSRA jifeng dai
1.abstract:
在目标检测领域,model object之间的关系能够提高检测的准确度,但是这种方法在基于深度学习的模型中还没有很好的work。当下主流的目标检测的方法还是对各个物体进行单独的检测,本文提出了一种object relation module,通过引入不同物体之间的外观和集合关系做interaction,实现对物体之间relation的建模。relation module参数不多,in-place,可以用来提高目标检测的性能以及实现duplicate removal(通过可以end-to-end学习的module替换nms),实现完全的end-to-end目标检测器。
2.Object relation module
作者的relation module和google的一篇做机器翻译的论文“attention is all your need”思想类似。模块的的应用可以增强fc输出的特征以及做duplicate removal,如下图所示:
这里的relation module是in-place的,也就是说,比如在instance recognition里面,输入的是300个object proposal的特征,经过relation module之后,输出的还是300个对应object proposal的特征,只不过这些特征都融合了其他object proposal的信息。
具体的,假设一个object proposal用他的几何特征 fG (4维的bounding box)以及外观特征 fA (典型的1024维)表示。对于给定的一组object { (fnA,f