CVPR2018一篇关于Visual Question Answering Tricks的文章,作者是2017 VQA Challenge冠军团队成员之一,paper连接https://arxiv.org/abs/1708.02711,作者的homepage https://www.damienteney.info/adventures。
文章要做的事情:
visual question answer
method
文章的framework如下所示。
主要思路是用bottom-up attention方式得到很多的proposal,然后在用Top-down attention学习这些proposal的权重。
本文介绍了一篇CVPR2018关于视觉问答(VQA)的文章,作者为2017VQA挑战赛冠军团队成员。文章提出一种结合自下而上与自上而下注意力机制的方法,先生成多个候选区域再学习这些区域的重要性权重。
1082

被折叠的 条评论
为什么被折叠?



