
cv
yang_live
这个作者很懒,什么都没留下…
展开
-
2020-10-09
基于注意力机制的文本生成:Image-to-text=-with-Visual-Attention训练过程:ai_challenageai_challenage的训练集有3w张,我只在前30000张训练图像上训练了这个模型。最后一层的特征提取VGG需要大约15GB的内存。训练过程中数据集被分成大小为64的批。一个epoch大约需要100秒。我训练了它大约20个周期,一次约一小时左右训练完成。训练结果:coco数据集:ai_challenage数据集下周工作计划:1.加入评价指标2原创 2020-10-10 08:58:26 · 247 阅读 · 0 评论 -
论文阅读-面向图像自动语句标注的注意力反馈模型
文献:吕凡,胡伏原,张艳宁,夏振平,盛胜利.面向图像自动语句标注的注意力反馈模型[J].计算机辅助设计与图形学学报,2019,31(07):1122-1129.主要工作在传统注意力基础上引入反馈机制,利用关注信息的图像特征指导文本生成,借助文本中的关注信息进一步修正图像中的关注区域,解决了传统注意力机制的注意分散问题。技术两种图像语义提取常用技术与ATTENTION结合1.基于全图:...原创 2020-06-19 09:23:43 · 241 阅读 · 0 评论 -
0318-本周改进
1.采用了random随机种子划分训练集,测试集2.采用了K折交叉验证3.特征组合60100150200300选择200个聚类中心点,每类选取10张图片生成聚类词汇,准确率略有降低,但训练时间大幅缩减首先,分别在60,100,150,200,300个聚类中心下进行实验,取最佳的实验结果200作为最终聚类簇。实验准确率达到0.55。缺点:因为实验是对所有图...原创 2020-03-19 16:45:54 · 169 阅读 · 0 评论