
vqa问题
yealxxy
一直学习计算机,了解互联网发展趋势。
展开
-
论文解读:Where To Look: Focus Regions for Visual Question Answering
可能要很久时间开始关注vqa问题,vqa问题就是图像的问答问题,即对图像提问,并产生答案。关于图像问答综述性文章推荐:Visual Question Answering:Datasets, Algorithms, and Future Challenges。今天开始可能要跟大家分析关于vqa的相关论文解读,今天是第一篇文章Where To Look: Focus Regions for Visu...原创 2018-11-21 20:55:41 · 1126 阅读 · 0 评论 -
论文解读:Hierarchical Question-Image Co-Attention for Visual Question Answering
这是关于VQA问题的第七篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Hierarchical Question-Image Co-Attention for Visual Question Answering1,主要思想:当前基于视觉注意的些VQA方法主要关注:”where to look”或者 visual attention。本文认为基于问题的atte...原创 2018-12-11 21:08:39 · 4665 阅读 · 1 评论 -
论文解读:Feature Enhancement in Attention for Visual Question Answering
这是关于VQA问题的第十篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Feature Enhancement in Attention for Visual Question Answering1,主要思想:这是2018年顶会(International Joint Conference on Artificial Intelligence )的一篇关于vq...原创 2018-12-21 23:02:39 · 727 阅读 · 0 评论 -
论文解读:Dual Attention Networks for Multimodal Reasoning and Matching
这是关于VQA问题的第八篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Dual Attention Networks for Multimodal Reasoning and Matching1,主要思想:这篇文章依然从多模态推理上介绍,不同的是文章引入两种类型的DANs进行多模态推理,匹配以及分类。 推理模型允许可视化并在协作推理期间用文本注意机制互相关联...原创 2018-12-15 20:11:22 · 2691 阅读 · 2 评论 -
论文解读:Dynamic Memory Networks for Visual and Textual Question Answering
这是关于VQA问题的第六篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Dynamic Memory Networks for Visual and Textual Question Answering1,主要思想:这篇文章是从动态记忆网络改进的:Ask Me Anything: Dynamic Memory Networks for Natural Lang...原创 2018-12-09 22:36:32 · 1394 阅读 · 0 评论 -
论文解读:记忆网络(Memory Network)
在了解vqa问题的论文时,发现有很多论文采用了记忆网络的思路,模拟推理过程,这篇文章主要总结关于记忆网络的三篇经典论文,目的是对记忆网络有个认识。分别是:MEMORY NETWORKS,End-To-End Memory Networks,Ask Me Anything: Dynamic Memory Networks for Natural Language Processing一,MEMO...原创 2018-12-09 13:20:19 · 31978 阅读 · 3 评论 -
论文解读:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering
这是关于VQA问题的第九篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering1,主要思想论文使用了目标检测算法,先找出候选的区域;然后再采用注意力机制去找到重要的区域。文章提出一种自上而下与自下而上...原创 2018-12-19 23:21:28 · 3664 阅读 · 0 评论 -
论文解读:A Focused Dynamic Attention Model for Visual Question Answering
这是关于VQA问题的第四篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:A Focused Dynamic Attention Model for Visual Question Answering。1,主要思想:Focused Dynamic Attention (FDA)模型: 通过问题的关键词,识别图像中重要的对象;并通过LSTM单元融合来自区域和全局特...原创 2018-12-05 21:36:26 · 1132 阅读 · 0 评论 -
论文解读:Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for VQA
这是关于VQA问题的第五篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering。1,主要思想:论文采用基于空间(图像)的记忆网络(记忆网络是NLP领域中的模型,用于处理逻辑推...原创 2018-12-07 21:13:00 · 1379 阅读 · 0 评论 -
论文解读:Stacked Attention Networks for Image Question Answering
这是关于VQA问题的第二篇系列文章,这篇文章在vqa领域是一篇比较有影响的文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Stacked Attention Networks for Image Question Answering。原论文中附有作者源码。1,论文想法作者认为在vqa(图像问答中),带有一定的推理过程。比如:“what are sitting in ...原创 2018-12-02 19:48:37 · 2018 阅读 · 0 评论 -
论文解读:Ask Your Neurons: A Neural-based Approach to Answering Questions about Images
这是关于VQA问题的第二篇系列文章,这篇文章是一篇比较经典的文章,所以跟大家分享。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Ask Your Neurons: A Neural-based Approach to Answering Questions about Images。1,想法模型以CNN和LSTM为基础,以一种新的使用方式,设计了一个预测结果长度可变的模...原创 2018-11-25 15:55:29 · 969 阅读 · 0 评论 -
论文解读:Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge
这是关于VQA问题的第十二篇系列文章。这篇论文具有很强的指导意义,本篇文章将介绍论文:主要思想;模型方法;试验细节。有兴趣可以查看原文:Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge1,论文思想这篇论文主要是提出一些细节上的优化提升vqa的结果。主要的细节包括如下:sigmoi...原创 2019-01-08 21:59:26 · 1514 阅读 · 1 评论