
cv
yang_live
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
2020-10-09
基于注意力机制的文本生成:Image-to-text=-with-Visual-Attention 训练过程:ai_challenage ai_challenage的训练集有3w张,我只在前30000张训练图像上训练了这个模型。最后一层的特征提取VGG需要大约15GB的内存。训练过程中数据集被分成大小为64的批。一个epoch大约需要100秒。我训练了它大约20个周期,一次约一小时左右训练完成。 训练结果: coco数据集: ai_challenage数据集 下周工作计划: 1.加入评价指标 2原创 2020-10-10 08:58:26 · 264 阅读 · 0 评论 -
论文阅读-面向图像自动语句标注的注意力反馈模型
文献:吕凡,胡伏原,张艳宁,夏振平,盛胜利.面向图像自动语句标注的注意力反馈模型[J].计算机辅助设计与图形学学报,2019,31(07):1122-1129. 主要工作 在传统注意力基础上引入反馈机制,利用关注信息的图像特征指导文本生成,借助文本中的关注信息进一步修正图像中的关注区域,解决了传统注意力机制的注意分散问题。 技术 两种图像语义提取常用技术与ATTENTION结合 1.基于全图:...原创 2020-06-19 09:23:43 · 254 阅读 · 0 评论 -
0318-本周改进
1.采用了random随机种子划分训练集,测试集 2.采用了K折交叉验证 3.特征组合 60 100 150 200 300 选择200个聚类中心点,每类选取10张图片生成聚类词汇,准确率略有降低,但训练时间大幅缩减 首先,分别在60,100,150,200,300个聚类中心下进行实验,取最佳的实验结果200作为最终聚类簇。 实验准确率达到0.55。 缺点: 因为实验是对所有图...原创 2020-03-19 16:45:54 · 181 阅读 · 0 评论