阿委困的不能行-优快云博客

原创【pytorch】register_hook、register_forward_hook 和 register_backward_hook

使用 register_hook 修改张量的梯度，比如实现梯度剪裁或自定义优化策略。

2024-12-11 22:52:42 1523

原创【python】getattr 和 setattr的用法，以及通过它们来动态的定义pytorch模块

net_depth=1 #单层cross attention中执行的次数):# 左右对称的两个attentionself.net_depth = net_depth # 保存 net_depth 为类属性])])

2024-12-05 23:17:06 620

原创【深度学习】transformer中的cross attention 快速理解

cross-attention快读理解和上手

2024-12-05 23:03:52 263

原创【python】下载huggingface模型报错：Last error: An error happened while trying to locate the file on the Hub 等

他提供了以下换源的方式比如换环境变量，使用他们提供的 hfd 工具等等，具体方法这里不再赘述了，他们的官网上面提供的有使用方法（个人感觉很多方法都不好使）。二，我们可以使用hugging face或者 hf-mirror的下载工具，以 hugging face的下载工具为例。我们可以想办法确定我们linux机器的缓存位置, 然后从能够科学上网的windows上拷贝过来。一，我们可以在win设备运行我们这一段代码，将系统缓存的权重保存下来，拷贝到liunx设备中去。把图中的第一行完整的输进去下载即可。

2024-11-29 01:06:16 3274

原创【python】windows pip 安装 module 提示 Microsoft Visual C++ 14.0 is required 处理方法

截至本博客发稿的时间，vs c++ build tool 已经有2022了，从微软官网上直接下载即可（网上很多百度云提供的旧版本的安装包，而且已经无法在线安装了）或者 conda install -c conda-forge +包名。很明显这是缺少C++的编译的相关依赖，这里提供两种方法解决这个问题。下载 build tool下载器安装后，重启即可。

2024-11-29 00:07:55 695

转载【ssh服务搭建】通过路由器端口映射，对局域网内服务器进行ssh登录

使用端口映射方法在子网内搭建ssh服务.。

2024-07-10 12:50:58 864

转载【linux】linux上杀死进程命令：kill、pkill、killall杀死进程

在linux上，一般常用的杀死进程的命令是kill，但是也有缺陷，下面说。3、强制杀死进程，有些进程可能杀不死，就加个-9参数，强制让它死掉！1、查看指定名称的进程，如下我查看运行python程序的进程。2、根据进程号（PID）杀死进程：第二列显示的就是进程号。如下是我多线程开启了20个程序，批量杀死进程，统统干掉！5、杀死多个进程，在后面跟多个进程的PID号即可。killall和pkill的用法几乎差不多。1、killall 批量杀死进程。2、killall 更多参数。2、pkill 更多参数。

2023-08-19 11:15:31 5096

原创【论文阅读】TransCAM: Transformer Attention-based CAM Refinement for WSSS

大多数现有的WSSS方法都是基于类激活映射（CAM）来生成像素级的伪标签，用于监督训练。但是基于CNN的WSSS方法只是凸出最具有区别性的地方，即CAM部分激活而不是整体对象。作者提出了TransCAM模型，它基于Conforme的backbone结构，利用transformer的attention权重来细化CNN分支的CAM。

2023-07-12 16:33:22 2391

原创【pytorch】单机多GPU报错 :Expected all tensors to be on the same device, but found at least two devices

单卡多GPU训练报错处理思路

2023-07-06 13:19:50 7532

转载【docker】上传自己的image到官方库

docker上传自己的镜像到官方库

2023-07-04 21:14:26 329

原创【docker】在windows下配置linux深度学习环境并开启ssh远程连接

liunux下配置深度学习程序方便，windows下用起来更习惯。windows下直接利用虚拟机是不太容易对GPU进行虚拟，利用docker就可以。这里简单介绍了在win主机下如利用docker，配置虚拟机环境，并和主机开启ssh连接配置。

2023-07-04 20:47:46 2159

原创【论文阅读】Self-supervised Image-specific Prototype Exploration for WSSS

WSSS论文阅读

2023-06-30 12:21:38 1178

转载【pytorch】ops.roi_align 参数解析

RoIAlign 用于将任意尺寸感兴趣区域的特征图，都转换为具有固定尺寸 H×W 的小特征图。ops.roi_align是一种在计算机视觉中常用的操作，用于将感兴趣区域 (Region of Interest, ROI) 对齐到固定大小的特征图上。该操作通常用于目标检测、目标识别和姿态估计等任务中。

2023-06-21 16:40:17 2326

转载【pytorch】固定模型部分权重进行训练

在深度学习领域，经常需要使用其他人已训练好的模型进行改进或微调，这个时候我们会加载已有的预训练模型文件的参数，如果网络结构不变，希望使用新数据微调部分网络参数。这时我们则需要冻结部分参数，禁止其更新。

2023-06-21 16:12:59 1605

原创【pytorch】反向传播遇到Nan的排查解决方式

pytorch遇到Nan数值的排查思路

2023-04-26 09:59:15 6184 1

转载【endnote】在wps上使用Endnote--解决错误

在wps上关联使用endnote

2023-03-20 15:08:30 9494 1

转载【python】矩阵嵌套的简单解释

最经典的一句话：矩阵A，和矩阵B，AB表示根据B矩阵的元素去索引矩阵A，得到与矩阵B大小相同的矩阵。

2023-03-04 22:46:44 855

转载【pytorch】tensor.backward() 解释

总结：对某个计算后的tensor求backward就是：依次对该tensor向上求梯度，然后把该梯度放到对应tensor.grad中。

2023-03-04 22:28:36 982

转载【python】call方法

python __call__方法

2023-03-04 21:45:08 247

原创【论文阅读】C2AM: Contrastive learning of Class-agnostic Activation Map for WSOL and SS

图像分类产生的CAM图通常集中于discriminative区域。作者提出了C2AM模型，使用未标记图像训练获得类不可知激活图(Class-agnostic Activation Map)。作者的idea主要是：1)前景对象和背景对象的语义信息通常差距较大。2）颜色或者纹理相近的前景或者背景对象有相似的表征。作者将这些关系梳理成正负对，然后利用对比学习分离前景和背景。

2023-02-27 17:11:42 1314 1

原创【论文阅读】Anti-Adversarially Manipulated Attributions for WSSS

作者提出了一种叫CAM的生成方法叫AdvCAM。它采用了和adversarial attack相反的方式，使得的图像的更多的非discriminative的区域，也参与到图像的分类中，进而产生更完整的CAM。此外作者还设计了新的regularization 方法来抑制与目标对象无关的区域（产生CAM），并限制已经得分较高的区域（产生CAM）。

2023-02-22 11:44:54 859 1

转载【深度学习】RoI Pooling 与 RoI Align

ROI Pooling与ROI Align简介

2023-02-14 09:49:04 1149

转载【pytorch】label的one-hot形式转换方法

进行网络训练时通常需要对label转为one-hot形式，下面给出自己知道的两种方法。

2023-02-13 21:40:13 899

转载【深度学习】Adam与SGD优化器的选择

发现若监督优化器的算法很多都采用SGD，选择Adam反而效果不好，所以这里学习了两者的区别。

2023-02-13 20:20:26 3300 2

转载【深度学习】Grad-CAM简介

总结：Grad-CAM是一种CAM的变式，使用回传的梯度作为权对特征图的每个通道进行加权求和。

2023-02-13 17:44:02 890

转载【linux】screen命令

在服务器上搭建一些服务的时候，经常要用到screen命令。某些服务开启的时候需要占据一整个控制台，如果关闭了就会导致进程终止。这就成了类似单进程的效果。而screen命令就是为了能够在服务器上开启多个控制面板(screen)，用以容纳不同的任务。

2023-02-07 09:05:55 3582

原创【论文阅读】Weakly Supervised Learning of Instance Segmentation with Inter-pixel Relations

作者提出了一种实例弱监督分割的模型：训练分类模型获得seeds，然后expansion获得更清晰的边缘。作者提出了IRNet，主打两点：1.使用了Instance label进行seeds的传播和扩展。2.在attention map上，借助 inter-pixel relations训练模型。

2023-01-01 19:02:17 826 1

原创【代码记录】（图像分割数据）转（VOC目标检测数据）转（coco目标检测数据）

最近帮忙跑了一个实验，要用目标检测算法检测处理分割数据集，于是就涉及到了这几种数据的互相转换的问题。主要利用opencv里面的外界矩阵方法获得边框，然后存储到xml文件中去：（VOC目标检测数据）转（coco目标检测数据）实验的算法是coco数据格式，之后将voc数据转为coco格式：数据读取和方框绘制使用coco库读取.json文件：绘制结果：

2022-12-06 12:25:17 757

原创【论文阅读】Weakly Supervised Semantic Segmentation using Out-of-Distribution Data

作者认为在WSSS任务中，会出现前景任务和背景任务的一些虚假的相关性，比如车轨和火车。作者利用分类器可能做出错误判断的方法，标注一些分布外(Out-of-Distribution)的数据。用这些数据提供的cue，来减弱分割中的错误关联性。该消耗了较小的标注成本，效果较好。

2022-11-17 22:28:09 1207 1

转载【pytorch】计算向量相似度

本文提供几个pytorch中常用的向量相似度评估方法，并给出其源码实现，供大家参考。分别为以下六个。（其中第一个pytoch自带有库函数）

2022-11-14 20:57:58 2050

原创【论文阅读】Threshold Matters in WSSS: Manipulating the Activation for the Robust and Accurat...

一篇弱监督分割论文阅读笔记

2022-11-10 19:07:55 629 5

转载【transfomer】transfomer中Q、K、V的理解

简单来说，Q和K用于计算相关性系数，V相当于原始序列。V在相关性系数的加权下获得注意力层的输出。

2022-11-05 12:05:22 4845

转载【nvidia-htop】GPU监控工具

常用的nvidia-smi工具看不到谁在用GPU，这里推荐一款GPU检测工具：nvidia-htop，仅支持 Linux。

2022-11-05 10:48:59 2049

转载【python】系统终端运行python文件报错“ImportError/ModuleNotFoundError：No Module named xx”

No Module named "xxx"解决办法

2022-11-05 10:17:29 945 1

转载【pip】pip安装github项目

pip安装github记录

2022-11-05 10:02:50 2456 1

原创【论文阅读】Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised Semantic Segmentation

弱监督分割是一项比较有挑战性的任务，仅依赖于图像级标签的CAM方法不足以提供完整的监督。1.作者提出了AuxSegNet，利用显著性检测(saliency detection）和多标签分类辅助改进WSSS任务。2.作者提出一种从显著reprentation和分割reprentation中学习cross-task global pixel level affinity 的方法，affinity 为显著性检测和CAM提供伪标签以refine其结果。

2022-11-03 21:50:25 854 1

原创【论文阅读】Online Attention Accumulation for Weakly Supervised Semantic Segmentation

1.在不同的训练阶段，网络对关注于目标的不同区域。基于此作者提出了Online Attention Accumulation（OAA）方法，利用不同阶段的训练注意力来获得更多完整的目标区域。2.由于某些目标在训练阶段注意力的特征变化不大，作者在Online Attention Accumulation加入了attention drop层（相当于遮挡一部分），去"扩大"网络在训练过程中注意力的运动范围。

2022-10-27 21:08:33 1170 1

原创【论文阅读】L2G: A Simple Local-to-Global Knowledge Transfer Framework for Weakly Supervised Semantic Seg

提出了L2G模型，一种从local知识到global知识的转移的框架。作者发现使用局部图像作为分类的输出，可以学习更多的细节区域，针对这点，作者首先利用一个局部分类网络，从输入图像中随机裁剪的多个local feature map中提取注意力（CAM）；然后global feature map中在线学习多个local feature map的互补知识。

2022-10-26 17:47:51 1989 1

原创【论文阅读】DenseCLIP: Language-Guided Dense Prediction with Context-Aware Prompting

CLIP模型对下游分类任务取得很好的效果，作者通过隐式和显式的利用CLIP中的预训练知识，提出一个密集型预测任务的框架，该框架通用于各种模型和主干网络，并在分割任务上有很好的效果。

2022-10-17 20:01:31 2039 1

原创【论文阅读】Extract Free Dense Labels from CLIP

许多论文研究了CLIP在图像分类的表现，作者提出了采用CLIP去处理像素型密集任务，如图像分割，作者提出了MaskCLIP和MaskCLIP+均取得了很好的效果。

2022-10-14 12:12:21 3091 2

空空如也

空空如也