Scene Graph Generation by Iterative Message Passing (CVPR 2017) 论文解读
简介
这篇文章在解决scene graph generation这个问题中更加偏向环境全局的上下文信息对于物体标签和关系预测带来的提升。为了获取和利用上下文信息,文章采用RNN-based的网络模型进行图推理。为了简化计算过程和提高计算效率,作者采用GRU(Gated Recurrent Unit)和Primal-Dual更新的做法。为了隐性的提取固定关系之间的关联,文章使用了一个message pooling层按照权重加权每个节点或者边对于下一次迭代的影响。
数学模型
p(x∣I,BI)=∏i∈V∏i!=jp(xicls,xibbox,xi→j∣I,BI)p({\bf x}|I,B_I)={\prod_{i\in V}}{\prod_{i!=j}}p(x_i^{cls},x_i^{bbox},x_{i\rightarrow j}|I,B_I)p(x∣I,BI)=∏i∈V∏i!=jp(xicls,xibbox,xi→j∣I,BI)
从上述的数学模型公式

本文介绍了一种基于迭代消息传递的场景图生成方法,该方法通过利用全局上下文信息来增强物体标签和关系预测。采用RNN-based模型和GRU进行图推理,结合Primal-Dual更新机制,实现端到端的网络优化。通过messagepooling层隐性提取关系间的关联。
最低0.47元/天 解锁文章
3540





