- 博客(6)
- 收藏
- 关注
原创 2021-09-26
将文件夹中同名的.jpg和.txt文件分开 #将图片与打标文件分开 import time import os import shutil def readFilename(path, allfile): filelist = os.listdir(path) for filename in filelist: filepath = os.path.join(path, filename) if os.path.isdir(filepath):
2021-09-26 13:22:10
138
原创 2021-09-20
论文笔记《Meshed-Memory Transformer for Image Captioning》 该论文改变原始编解码中transfomer的结构,原始的attention结构将每个输入与所有输入进行加权和得到输出。如果输入是一个句子的所有单词的嵌入向量,那么输出是加了不同权重后的单词向量。如果编码器用transfomer来对图像区域进行编码,输入是一个图像区域的特征,输出是在这个区域内加了注意力后的区域特征。对于一幅图像会有多个区域特征,transfomer的局限在于不同区域特征间的先验关系无法得
2021-09-20 17:51:32
288
原创 2021-07-30
Image Caption知识整理 论文:nocaps: novel object captioning at scale Nocaps:400 novel objects 这部分在笔记本上 论文:VIVO: Visual Vocabulary Pre-Training for Novel Object Captioning(CVPR,2021.3.4) 两阶段: 预训练阶段:模型学习用标签去打标图像区域用图像-标签对作为训练数据 微调阶段:给检测到的图像描述对及其相应的对象标签,模型学习将图像映射到句子
2021-07-30 13:56:46
320
原创 2021-07-30
《Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering》论文笔记 GitHub链接: https://github.com//peteanderson80/bottom-up-attention 本文提出一种自上而下与自下而上相结合的注意力模型方法,应用于视觉场景理解和视觉问答系统的相关问题。其中基于自下而上的关注模型(使用Faster R-CNN)用于提取图像中的兴趣区域,获取对象特征;而基于
2021-07-30 13:48:57
159
原创 2021-06-02
工件匹配MFC框架搭建 创建基于对话框的MFC项目: 对话框界面: 打开文件 按钮ID是button1负责选择要匹配的图,并显示在下方的picture control控件中。主要代码(直接双击按钮就可以在里面写代码): void CMFCApplicationDlg::OnBnClickedButton1() { // TODO: 在此添加控件通知处理程序代码 //读入待检测图像 CFileDialog dlg( TRUE, _T("*.bmp"), NULL, OFN_FILEMUSTE
2021-06-02 22:33:20
237
原创 linux常用指令记录
linux 常用指令记录 nvidia-smi 看哪个卡有内存 conda creata -n +虚拟环境名 +python=x.x 创建python版本为x.x的虚拟环境 conda env list 查看有哪些环境 source activate +环境名
2021-03-24 17:22:49
141
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人