
视觉问答学习
实现各类视觉问答模型
全部梭哈迟早暴富
这个作者很懒,什么都没留下…
展开
-
视觉问答学习(二)——堆叠注意力网络SAAA(tensorflow实现)(未完待续)
一、背景本文实现的模型来自于论文:《Show, Ask,Attend, and Answer:A Strong Baseline For Visual Question Answering》该模型比较经典,也是本系列的第二篇视觉问答模型,主要参考代码【1】,但是由于原模型中,数据集封装的比较好,复现到其他数据集上的话会比较困难,因此我把数据集部分的读取和加载做了改动。【1】https://github.com/momih/vqa_tensorflow二、论文简介这篇论文之前介绍过,这里.原创 2020-07-10 16:16:12 · 720 阅读 · 0 评论 -
视觉问答学习(一)——视觉问答的动态记忆网络DMN+(tensorflow实现)
一、背景本文实现的模型来自于论文:《Dynamic Memory Networks for Visual and Textual Question Answering》之前做了两个月杂活,最近该上手实验了,这里先从别人的实验开始学习。这篇是视觉问答实验的第一篇。实验数据比较多,图片用的是COCO的,文本标注是VQA 1.0的,另外还用到了vgg16,所以需要准备的东西也非常多。二、...原创 2019-11-18 17:27:03 · 4602 阅读 · 0 评论