Jennifer-优快云博客

原创 2021-09-26

将文件夹中同名的.jpg和.txt文件分开#将图片与打标文件分开import timeimport osimport shutildef readFilename(path, allfile): filelist = os.listdir(path) for filename in filelist: filepath = os.path.join(path, filename) if os.path.isdir(filepath):

2021-09-26 13:22:10 160

原创 2021-09-20

论文笔记《Meshed-Memory Transformer for Image Captioning》该论文改变原始编解码中transfomer的结构，原始的attention结构将每个输入与所有输入进行加权和得到输出。如果输入是一个句子的所有单词的嵌入向量，那么输出是加了不同权重后的单词向量。如果编码器用transfomer来对图像区域进行编码，输入是一个图像区域的特征，输出是在这个区域内加了注意力后的区域特征。对于一幅图像会有多个区域特征，transfomer的局限在于不同区域特征间的先验关系无法得

2021-09-20 17:51:32 318

原创 2021-07-30

Image Caption知识整理论文：nocaps: novel object captioning at scaleNocaps：400 novel objects这部分在笔记本上论文：VIVO: Visual Vocabulary Pre-Training for Novel Object Captioning（CVPR,2021.3.4）两阶段：预训练阶段：模型学习用标签去打标图像区域用图像-标签对作为训练数据微调阶段：给检测到的图像描述对及其相应的对象标签，模型学习将图像映射到句子

2021-07-30 13:56:46 347

原创 2021-07-30

《Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering》论文笔记GitHub链接: https://github.com//peteanderson80/bottom-up-attention本文提出一种自上而下与自下而上相结合的注意力模型方法，应用于视觉场景理解和视觉问答系统的相关问题。其中基于自下而上的关注模型（使用Faster R-CNN）用于提取图像中的兴趣区域，获取对象特征；而基于

2021-07-30 13:48:57 201

原创 2021-06-02

工件匹配MFC框架搭建创建基于对话框的MFC项目：对话框界面：打开文件按钮ID是button1负责选择要匹配的图，并显示在下方的picture control控件中。主要代码（直接双击按钮就可以在里面写代码）：void CMFCApplicationDlg::OnBnClickedButton1() { // TODO: 在此添加控件通知处理程序代码 //读入待检测图像 CFileDialog dlg( TRUE, _T("*.bmp"), NULL, OFN_FILEMUSTE

2021-06-02 22:33:20 266

原创 linux常用指令记录

linux 常用指令记录nvidia-smi 看哪个卡有内存conda creata -n +虚拟环境名 +python=x.x 创建python版本为x.x的虚拟环境conda env list 查看有哪些环境source activate +环境名

2021-03-24 17:22:49 176 1

weixin_44928039的博客

原创 2021-09-26

原创 2021-09-20

原创 2021-07-30

原创 2021-07-30

原创 2021-06-02

原创 linux常用指令记录

空空如也

空空如也