duoyasong5907-优快云博客

原创 mmaction2教程(4) 记一次训练复现失败的检查过程

我在试图复现时，发现训练loss不收敛。官方。

2025-04-02 17:45:12 1

原创 mmaction2教程(2) Q&A

给类加上register装饰器以后，在tarin.py将这个类import。

2025-04-02 17:25:06 13

原创昇腾torch.multiprocessing.spawn分布式训练使用pytorch迁移

这样每个子进程启动时都能自动迁移NPU。开头添加NPU迁移的操作。假设你的程序程序基于。那么，可以在进程函数。

2025-04-02 09:52:14 5

原创 pip install -e detectron2_repo报错

【代码】pip install -e detectron2_repo报错。

2025-04-01 17:42:23 87

原创 pip install cryptacular卡住，卡在downloading阶段

参数，可以展示安装过程卡在哪一步，比如笔者加上参数后，发现卡在了下载scon这一步(如下日志所示)。于是从本地PC下载whl包后，上传到机器安装。笔者安装pip install cryptacular卡在downloading阶段，但不知道为何。之后再安装cryptacular即可。解决办法是，首先加上。

2025-03-29 17:17:33 326

原创 ImportError: libGL.so.1: cannot open shared object file

【代码】ImportError: libGL.so.1: cannot open shared object file。

2025-03-29 15:59:30 358

原创 mmaction2的mmcv依赖安装教程

如所说，mmcv与其它mm家族的兼容情况十分逆天。

2025-03-28 11:52:06 21

原创内网anaconda如何使用代理，避免网络连接失败？

其中channels可以替换成其它源，比如清华源、阿里源。

2025-03-10 19:25:07 135

原创位置编码(三.2) 苏剑林讲旋转位置编码推导解析

书接上文关于原文的如下内容，对于第二个等号的两边，有三种方式验证：

2025-03-07 16:39:19 37

原创高数往事(1.2) 二维、高维空间下余弦定理、点乘公式的证明与相互推导

参考《线性代数原书第七版中文利昂著》第211页。证明余弦定理需要使用向量点乘公式。

2025-03-04 14:55:00 42

原创位置编码(三.1) 苏剑林讲旋转位置编码数学基础

假设你已经了解RoPE的公式，本文将着重RoPE的求解过程。之前，苏剑林对RoPE给出了数学推导，具体可以看他的博客系列，先阅读。的"其他位置编码"，"融合式"一节，之后再阅读。

2025-03-03 14:18:22 56

转载线代往事(1.3) 无序图的邻接矩阵乘幂可以求任意两顶点间给定长度的路的条数。

https://blog.youkuaiyun.com/qq_24118527/article/details/82313673

2025-02-27 10:46:39 17

原创 AI视频编码器(3.2) 《Swin Transformer V2: Scaling Up Capacity and Resolution》

本文的主要贡献如下：

2025-02-01 17:12:44 832

原创 AI视频编码器(3.1)《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》

第一个patch merging layer的行为，根据原文，其输入的维度为2×2×C，输出的维度为1×1×2C。

2025-01-26 15:01:37 776

原创 IndexError: piece id is out of range.

解决方法是，把以下的语句订正，令输入参数放置到当前进程被分配到的设备。如果是"cuda"，会默认放置到设备0上。所说的一样，报错原因并非真正原因。他的博客中实际问题是模型加载到了相同设备导致OOM。而我的情况也是一样，报错信息与实际问题毫无关系。

2025-01-09 16:02:32 204

主要参考腾讯教程的"二、在EulerOS（欧拉系统）上编译安装FFmpeg"一节。以下是我跟随教程执行的一些经验：第一步，，安装前确保配好了yum镜像。安装时如果权限不足，可以用sudo。我安装g++时报错找不到，但跳过也没关系。第二步，安装x264，执行如果权限不足，可以使用sudo，下同。作者使用非root用户执行和make都没用到root权限，只在运行时用到了。最后，记得要执行，如果没报错输出了各个组件的版本信息，才说明安装成功。

2025-01-02 11:42:46 582

原创报错WARNING: tokenization mismatch: 173 vs. 169. (ignored)

由下面代码可知，程序会遍历对话的文字，期间把属于用户指令的token id覆盖为IGNORE_INDX，最后会判断cur_len与total_len是否相等。cur_len记录了遍历后所处的位置，total_len记录了文字总长度。如果不相等，说明tokenizer的分词行为与作者硬编码的遍历行为有差别，主要问题可能在于。升级安装tokenizers==0.13.3以后，设置use_fast=True。这行代码，作者想当然地认为通过-2可以舍去某些文字，但那个文字可能分成3个token。

2025-01-02 09:47:22 1113

原创 Local variable ‘tokens‘ referenced before assignment error in tokenization_llama.py

我们到https://github.com/huggingface/transformers/releases?page=5 找到v4.33.1的时间为2023年9月，所以此时已修复该bug。https://github.com/huggingface/transformers/pull/25793，时间为2024年8月。之前作者用的是transoformers v4.32.0，其发布刚好在这个bug被修复的时间点之前。

2024-12-28 15:24:47 216

原创 torch.multiprocessing 向Process传递对象参数报错 Can‘t pickle local object

如下代码所示，使用torch.multiprocessing启动多进程，并传递了model和image_processor两个对象作为参数。

2024-12-17 16:45:13 456

原创 accelerate launch 启动多节点训练实际进程数少于预期

在多个节点上用accelerate launch启动多节点训练，预计有3个节点，每个节点8张卡，结果运行程序后发现每个节点上只有两个训练进程。

2024-12-10 15:13:53 400

原创昇腾pytorch 混合精度/半精度训练不生效

在昇腾NPU卡上训练，不管是否在代码中添加，显存占用都没变化。

2024-12-10 15:02:28 380 2

原创 pytorch worker数设置为0导致显存OOM

可能是因为不小心设置了woker数为0，导致各个batch的数据都读取到显存上了。设置worker=16后就好了。

2024-11-13 19:10:05 123

原创深入理解torch.functional.cross_entropy或F.cross_entropy的原理

由此可知，torch的CE loss会先沿着prediciton score矩阵的每一行计算softmax操作，再全部计算log。最后再基于negative likelyhood loss去计算最终的loss。因此，其实CrossEntropyLoss损失，就是softmax + log + nll_loss的集成。

2024-11-07 15:44:25 212