LinkNet(NIPS 2018)
文章
一两个月前在NIPS2018的官网上看到这篇论文,最近终于在arxiv上看到了,于是迫不及待地就读了,下面就来一起来看看这篇来自KAIST的LinkNet吧。
论文的主要创新点是对于scene graph generating任务设计了一个relational embedding module,可以利用图片中所有的物体的特征对某个物体的特征进行更新,此外还提出了Global context encoding module来encode全局的context信息,和geometric layout encoding module来显式使用几何布局的信息。

Global Context Encoding Module:
将整张图片的信息encode成一个特征,concat到每一个物体的特征后面。而整张图的信息则是通过一个对图片进行多分类的任务得到的,直接取多分类的FC层前一层的AvgPool的结果作为global context。注意一张图上的所有物体都用的是这个global context。
Object Feature:
除了用RoIAlign得到的feature以及global context外,每个bound