bilinear
文章平均质量分 82
等风人
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
《MUTAN: Multimodal Tucker Fusion for Visual Question Answering》阅读笔记
《MUTAN: Multimodal Tucker Fusion for Visual Question Answering》阅读笔记 一、研究背景 Bilinear models在视觉问答(VQA)任务中进行信息融合提供了一个吸引人的框架。 它们有助于学习question meaning 和 visual concepts in the image之间的高层次关系,但它们存在高维度问题。 论...原创 2018-08-04 12:26:06 · 3006 阅读 · 0 评论 -
《Visual Question Generation as Dual Task of Visual Question Answering》阅读笔记
《Visual Question Generation as Dual Task of Visual Question Answering》阅读笔记 一、研究背景 视觉问答(VQA)和视觉问题生成(VQG)是计算机视觉中的两个主题,但它们通常是分开探索的,尽管它们具有内在的互补关系。 在本文中,提出了一个端到端的统一模型,即可逆问答网络(iQAN),将问题生成作为问题回答的双重任务来引入,...原创 2018-08-04 16:31:43 · 1578 阅读 · 0 评论
分享