weixin_42863990-优快云博客

原创 Boost.python安装和踩坑记录

Boost.python可以用来包装cpp的函数和类；python可以通过import的方式导入被包装后的动态链接库。但是配置和安装的这几天真的是狠狠地重温了老式教程的恶意，最后还是官方文档加一堆千奇百怪的教程才搞定。版本、Boost编译的参数、shared 编译的命名之类的都有可能会影响最后的结果！！！和我一样是cmake小白的人最好不要随意改动版本和参数。

2023-04-27 13:35:10 4387 2

原创 git配置私有仓库，用于在堡垒机间接传递修改

最近用的服务器加了一个堡垒机，不能直接用ssh访问（所有相关的都不行，比如vscode、pycharm巴拉巴拉），同时服务器也没办法访问GitHub。但是这些实验在我的破笔记本又跑不起来，无奈之下只好暂时掏出之前玩饥荒买的服务器，来暂时做git的仓库。tips: 其实不一定要一个服务器作为仓库，因为是只有自己在用，在本地开一个远程仓库也是可以的（搭完才发现）。

2023-04-20 19:20:42 396

原创 openCV-python resize时通道数超512的错误和解决方法

在resize特征图或者视频序列的时候，为了简洁通常将多个特征图stack后处理。如果坚持使用cv2的话，只能将图像按通道分块处理。但是stack处理本来就是为了看起来简洁，又要分块实在受不了。

2023-03-29 15:37:53 632

最近在一个无root的服务器下载了超大的7z文件，结果解压的时候发现没有7za傻眼了，后面无root安装的时候还踩了几个坑，记录一下。首先来到user放工具的目录中，没有可以新建一个:然后下载p7z的源码：注意make install的时候会调用 install.sh 并且默认安装到home里面（需要root权限），所以我们需要修改一下默认安装路径：修改install.sh的DEST_HOME为有权限的目录，如：然后执行安装:这个时候实际上已经安装好了，但是使用起来非常麻烦，需要使用绝对路劲来启

2022-06-13 17:04:23 3182 2

原创 pytorch在测试时显存增加

在训练中的过程中，会使用以下代码清空optimizer的梯度：optimizer.zero_grad()虽然在test过程中梯度不需要反向传播，但是网络还是会保存optimizer的梯度，如果optimizer保存在cuda中，显存就会逐渐增大。解决方法： with torch.no_grad(): for batch_idx, (img, label) in enumerate(testloader): img, label

2021-10-14 17:20:56 1102

原创 TypeError: torchvision.transforms.transforms.RandomCrop is not a Module subclass

transforms = torch.nn.Sequential( transforms.RandomCrop(224), transforms.Normalize((0.25516997,0.25296235,0.24626788), (0.28230251,0.23966205,0.24667897)) )scripted_transforms = torch.jit.script(transforms)338 if not isinstance(modu

2021-10-12 13:50:13 2460

原创 Dual Adversarial Graph Neural Networks for Multi-label Cross-modal Retrieval 论文笔记

Dual Adversarial Graph Neural Networks for Multi-label Cross-modal RetrievalAAAI2021 跨模态方向的论文。我终于也开始刷这种新的论文啦，不过第一篇(理论上是第二篇，之前看过一个图构建局部语义的)就面临大挑战，因为它使用的是NUS-WIDE和MIRFlickr数据集，评价指标用的是mAP，这和我往常看到的SCAN之类的图文matching方法用到的数据集MSCOCO和Flickr30K似乎不是很相似。说不定这是两个不同的领域

2021-09-29 13:04:43 999 4

原创 Beyond the Deep Metric Learning 论文笔记

Beyond the Deep Metric Learning: Enhance the Cross-Modal Matching with Adversarial Discriminative Domain Regularization该论文提出了一个ADDR的结构来为数据的特征获得域不变性，进而为获得更好的跨模态检索性能。与一般的域不变性辨别器相比，该论文认为不同的数据对可能会在域空间上有重叠的部分，使用一个单一的辨别器可能没办法取得最好的效果，所以对于每一个数据对，训练时都会生成一个对应的辨别器

2021-09-15 21:24:36 150

原创 PFAN++: Bi-Directional Image-Text Retrieval with Position Focused Attention Network论文笔记

PFAN++: Bi-Directional Image-Text Retrieval with Position Focused Attention NetworkMotivation该论文认为在图像中央的目标往往比不在图像中央的目标重要，可是这也不是绝对的，region 的位置信息对于图像的权重应该是有贡献的，所以在PFAN的基础上提出了一个嵌入图像位置信息的方法。MethodPFAN++模型的特点有：它在计算相似度时同时考虑了全局的相似度和局部相似度，使用一个参数控制两个相似度对总相似度

2021-09-09 21:00:24 602

原创 Adaptive Cross-modal Embeddings for Image-Text Alignment论文笔记

Adaptive Cross-modal Embeddings for Image-Text Alignment该论文提到cross model retrieval中一般使用三个类型的方法：使用特征提取方法提取不同模态的高维特征并将其嵌入到相同的隐空间中，然后通过距离排名，计算嵌入到隐空间后的不同模态的数据的距离，将排名在前@N的结果作为匹配对象。使用注意力机制获取不同模态的数据的细粒度对齐，然后计算每个区域的相似度，并将结果进行排名，返回前N个结果作为匹配对象。使用一个统一的模型输入不同模态的数

2021-09-09 10:26:53 327

原创 Hashing based Efficient Inference for Image-Text Matching论文笔记

Hashing based Efficient Inference for Image-Text Matchingmotivation这篇论文认为今年提出的image-text matching方法，虽然达到了很好的效果，但是由于在匹配的时候需要同时输入查询词和被查询词到跨模态注意力机制中，这将消耗大量的时间，在实际使用的时候是不可接受的，因此提出了HEI模块为现存的cross model retrieval在不影响性能的前提下加快检索速度。（最近我也想能不能从这边着手没想到就碰到了这篇论文。。。）C

2021-09-06 21:07:01 365 1

原创 Graph Structured Network for Image-Text Matching论文笔记

Graph Structured Network for Image-Text Matching该论文认为，现在的工作学习图文匹配时，是基于不同模态的对象共同出现的共现统计数据来学习“粗糙”对应关系的，这忽略了短语之间的细粒度语义相关。所以作者提出了将region和word构建为无向图结构，通过对无向图mulit-block的match来计算相似度。其主要可以分为图构建，node-level matching 和structure-level matching。sentence图构建的时候，使用st

2021-09-05 21:40:53 439

原创 Context-Aware Attention Network for Image-Text Retrieval论文笔记

Context-Aware Attention Network for Image-Text Retrieval该论文认为，不同的查询词应该要对模态内的特征表达产生影响。因此提出了一个结构CAAN并且提出了一种基于语义的注意力机制SA。论文首先使用FasterRCNN提取region然后resnet提取visual feature，使用bigru提取textual feature，将往前和往后的textual feature直接相加起来。然后进行基于上下文的注意力操作。计算一个相似矩阵H，对visu

2021-09-05 16:13:14 796

weixin_42863990的博客

原创 Boost.python安装和踩坑记录

原创 git配置私有仓库，用于在堡垒机间接传递修改

原创 openCV-python resize时通道数超512的错误和解决方法

原创 p7za无root权限安装/7z linux安装

原创 pytorch在测试时显存增加

原创 TypeError: torchvision.transforms.transforms.RandomCrop is not a Module subclass

原创 Dual Adversarial Graph Neural Networks for Multi-label Cross-modal Retrieval 论文笔记

原创 Beyond the Deep Metric Learning 论文笔记

原创 PFAN++: Bi-Directional Image-Text Retrieval with Position Focused Attention Network论文笔记

原创 Adaptive Cross-modal Embeddings for Image-Text Alignment论文笔记

原创 Hashing based Efficient Inference for Image-Text Matching论文笔记

原创 Graph Structured Network for Image-Text Matching论文笔记

原创 Context-Aware Attention Network for Image-Text Retrieval论文笔记

原创 MSCOCO(pycocotools)如何根据图片ID获取标签/分类

原创 Pytorch CrossEntropyloss使用方法（包含多维target）

原创简单的图像特效（上）

原创简单的数据增广（Data Augmentation）（附代码）

原创 VOC格式数据转COCO格式

原创 Tsp问题使用遗传算法求解以及python代码

空空如也

空空如也