自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 Boost.python安装和踩坑记录

Boost.python可以用来包装cpp的函数和类;python可以通过import的方式导入被包装后的动态链接库。但是配置和安装的这几天真的是狠狠地重温了老式教程的恶意,最后还是官方文档加一堆千奇百怪的教程才搞定。版本、Boost编译的参数、shared 编译的命名之类的都有可能会影响最后的结果!!!和我一样是cmake小白的人最好不要随意改动版本和参数。

2023-04-27 13:35:10 4387 2

原创 git配置私有仓库,用于在堡垒机间接传递修改

最近用的服务器加了一个堡垒机,不能直接用ssh访问(所有相关的都不行,比如vscode、pycharm巴拉巴拉),同时服务器也没办法访问GitHub。但是这些实验在我的破笔记本又跑不起来,无奈之下只好暂时掏出之前玩饥荒买的服务器,来暂时做git的仓库。tips: 其实不一定要一个服务器作为仓库,因为是只有自己在用,在本地开一个远程仓库也是可以的(搭完才发现)。

2023-04-20 19:20:42 396

原创 openCV-python resize时通道数超512的错误和解决方法

在resize特征图或者视频序列的时候,为了简洁通常将多个特征图stack后处理。如果坚持使用cv2的话,只能将图像按通道分块处理。但是stack处理本来就是为了看起来简洁,又要分块实在受不了。

2023-03-29 15:37:53 632

原创 p7za无root权限安装/7z linux安装

最近在一个无root的服务器下载了超大的7z文件,结果解压的时候发现没有7za傻眼了,后面无root安装的时候还踩了几个坑,记录一下。首先来到user放工具的目录中,没有可以新建一个:然后下载p7z的源码:注意make install的时候会调用 install.sh 并且默认安装到home里面(需要root权限),所以我们需要修改一下默认安装路径:修改install.sh的DEST_HOME为有权限的目录,如:然后执行安装:这个时候实际上已经安装好了,但是使用起来非常麻烦,需要使用绝对路劲来启

2022-06-13 17:04:23 3182 2

原创 pytorch在测试时显存增加

在训练中的过程中,会使用以下代码清空optimizer的梯度:optimizer.zero_grad()虽然在test过程中梯度不需要反向传播,但是网络还是会保存optimizer的梯度,如果optimizer保存在cuda中,显存就会逐渐增大。解决方法: with torch.no_grad(): for batch_idx, (img, label) in enumerate(testloader): img, label

2021-10-14 17:20:56 1102

原创 TypeError: torchvision.transforms.transforms.RandomCrop is not a Module subclass

transforms = torch.nn.Sequential( transforms.RandomCrop(224), transforms.Normalize((0.25516997,0.25296235,0.24626788), (0.28230251,0.23966205,0.24667897)) )scripted_transforms = torch.jit.script(transforms)338 if not isinstance(modu

2021-10-12 13:50:13 2460

原创 Dual Adversarial Graph Neural Networks for Multi-label Cross-modal Retrieval 论文笔记

Dual Adversarial Graph Neural Networks for Multi-label Cross-modal RetrievalAAAI2021 跨模态方向的论文。我终于也开始刷这种新的论文啦,不过第一篇(理论上是第二篇,之前看过一个图构建局部语义的)就面临大挑战,因为它使用的是NUS-WIDE和MIRFlickr数据集,评价指标用的是mAP,这和我往常看到的SCAN之类的图文matching方法用到的数据集MSCOCO和Flickr30K似乎不是很相似。说不定这是两个不同的领域

2021-09-29 13:04:43 999 4

原创 Beyond the Deep Metric Learning 论文笔记

Beyond the Deep Metric Learning: Enhance the Cross-Modal Matching with Adversarial Discriminative Domain Regularization该论文提出了一个ADDR的结构来为数据的特征获得域不变性,进而为获得更好的跨模态检索性能。与一般的域不变性辨别器相比,该论文认为不同的数据对可能会在域空间上有重叠的部分,使用一个单一的辨别器可能没办法取得最好的效果,所以对于每一个数据对,训练时都会生成一个对应的辨别器

2021-09-15 21:24:36 150

原创 PFAN++: Bi-Directional Image-Text Retrieval with Position Focused Attention Network论文笔记

PFAN++: Bi-Directional Image-Text Retrieval with Position Focused Attention NetworkMotivation该论文认为在图像中央的目标往往比不在图像中央的目标重要,可是这也不是绝对的,region 的位置信息对于图像的权重应该是有贡献的,所以在PFAN的基础上提出了一个嵌入图像位置信息的方法。MethodPFAN++模型的特点有:它在计算相似度时同时考虑了全局的相似度和局部相似度,使用一个参数控制两个相似度对总相似度

2021-09-09 21:00:24 602

原创 Adaptive Cross-modal Embeddings for Image-Text Alignment论文笔记

Adaptive Cross-modal Embeddings for Image-Text Alignment该论文提到cross model retrieval中一般使用三个类型的方法:使用特征提取方法提取不同模态的高维特征并将其嵌入到相同的隐空间中,然后通过距离排名,计算嵌入到隐空间后的不同模态的数据的距离,将排名在前@N的结果作为匹配对象。使用注意力机制获取不同模态的数据的细粒度对齐,然后计算每个区域的相似度,并将结果进行排名,返回前N个结果作为匹配对象。使用一个统一的模型输入不同模态的数

2021-09-09 10:26:53 327

原创 Hashing based Efficient Inference for Image-Text Matching论文笔记

Hashing based Efficient Inference for Image-Text Matchingmotivation这篇论文认为今年提出的image-text matching方法,虽然达到了很好的效果,但是由于在匹配的时候需要同时输入查询词和被查询词到跨模态注意力机制中,这将消耗大量的时间,在实际使用的时候是不可接受的,因此提出了HEI模块为现存的cross model retrieval在不影响性能的前提下加快检索速度。(最近我也想能不能从这边着手没想到就碰到了这篇论文。。。)C

2021-09-06 21:07:01 365 1

原创 Graph Structured Network for Image-Text Matching论文笔记

Graph Structured Network for Image-Text Matching该论文认为,现在的工作学习图文匹配时,是基于不同模态的对象共同出现的共现统计数据来学习“粗糙”对应关系的,这忽略了短语之间的细粒度语义相关。所以作者提出了将region和word构建为无向图结构,通过对无向图mulit-block的match来计算相似度。其主要可以分为图构建,node-level matching 和structure-level matching。sentence图构建的时候,使用st

2021-09-05 21:40:53 439

原创 Context-Aware Attention Network for Image-Text Retrieval论文笔记

Context-Aware Attention Network for Image-Text Retrieval该论文认为,不同的查询词应该要对模态内的特征表达产生影响。因此提出了一个结构CAAN并且提出了一种基于语义的注意力机制SA。论文首先使用FasterRCNN提取region然后resnet提取visual feature,使用bigru提取textual feature,将往前和往后的textual feature直接相加起来。然后进行基于上下文的注意力操作。计算一个相似矩阵H,对visu

2021-09-05 16:13:14 796

原创 MSCOCO(pycocotools)如何根据图片ID获取标签/分类

最近我需要使用pycocotools根据图片id获取categories。但是网上只有mscoco官方例程中的根据catids获取image,所以我从cocoapi的源码里找到了解决办法,记录如下。实现方法coco = COCO(labels_file)imgIds = coco.getImgIds()# 此处imgIds代表了所需查阅的图片idannIds = coco.getAnnIds(imgIds = imgIds[0])anns = coco.loadAnns(annIds)labe

2021-03-28 18:09:46 1510

原创 Pytorch CrossEntropyloss使用方法(包含多维target)

Pytorch CrossEntropyloss使用方法(包含多维target)以前都是用tf,最近转来用pytorch。最近博主做一个东西需要用到crossentropyloss,输出是多维输出的。一开始胡乱弄搞出了一个这样子的bug:RuntimeError: multi-target not supported at在这里插入代码片然后博主寻求百度,结果发现网上大部分人都只是在照搬例...

2020-05-08 10:31:26 6218 2

原创 简单的图像特效(上)

文章目录简单介绍正文灰度变换马赛克浮雕油画全局均衡化EMMM简单介绍博主是某工大的学生,最近在做各科的课设,然后其中一个是C++图像处理的课程设计。做这种东西没啥技术含量,但是加上写报告又得浪费个一两天的时间。为了节约各位大佬们的时间(为了打发无聊),我在这里简单总结一下之前查到的各种简单的图像处理特效实现方法,尽量帮到想要想要学习图像处理特效的大家。在评论里我会贴上一个完整的实现链接。帮...

2020-01-12 17:25:25 470

原创 简单的数据增广(Data Augmentation)(附代码)

简单的数据增广(Data Augmentation)博主最近做一个小样本的项目,当时时间紧迫,就找了几何变换的数据增广方法。数据增广的原理就不说了,Some Improvements on Deep Convolutional Neural Network Based Image Classification这篇文章里有对我用的方法和作用有简单的介绍。废话少说,现在开始说重点吧。方法本文为...

2020-01-12 14:53:14 7587 1

原创 VOC格式数据转COCO格式

VOC格式数据转COCO格式简单介绍VOC2COCO简单介绍博主使用labelme对目标检测数据进行标注的时候,标注的结果只能选择是VOC格式的文件。但是,现在新的网络一般都是用COCO格式的数据进行运行的。所以,一个VOC转COCO格式的代码就变得非常重要了。这篇博客主要是为了数据增广的那篇做引用的,所以原理就不说了,直接上代码吧。VOC2COCO在实际运行运行的时候,数据有多少类,就把...

2020-01-12 14:33:18 410

原创 Tsp问题使用遗传算法求解以及python代码

Tsp问题使用遗传算法求解以及python代码Tsp问题遗传算法介绍遗传算法用在tsp的问题代码实现节点生成GA训练结果总结Tsp问题旅行商问题,即TSP问题(Traveling Salesman Problem)又译为旅行推销员问题、货郎担问题,是数学领域中著名问题之一。假设有一个旅行商人要拜访n个城市,他必须选择所要走的路径,路径的限制是每个城市只能拜访一次,而且最后要回到原来出发的城市。...

2019-09-12 14:15:32 5669 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除