洁宝趴趴-优快云博客

原创 ImportError: No module name upfirdn2d_plugin “已解决

出现了以上的报错，关于cuda，ninja,torch,torchvision.torchaudio等的版本问题。代码的环境是cuda11.0和python3.7。

2025-10-23 00:02:37 220

原创 Powerpaint代码调通记录

我在运行v1的时候出现了网页打不开的情况，于是我在命令里加入了--share就好了。首先根据权重找不到这个，我感觉主要是各种路径以及数据读取的代码没有修改的原因。v2的权重会大一些，两个权重加起来有几十G（不超过50G），要提前打开梯子。可以直接重新git clone 这位大佬最新修改过的powerpaint。................................等。把safetensor降低到0.5版本以下。

2025-10-22 15:21:32 922

原创 safetensors文件转到bin文件（报错AttributeError: module ‘safetensors‘ has no attribute ‘torch‘）

等属性时，需要 PyTorch 版本达到 2.3.0 或更高。可能需要特定版本的 PyTorch 才能正常工作。原来安装的safetensors0.6.2有点高，改为。针对我的低版本的torch1.12.1+cu116。：该文件通常位于您的 Python 环境下的。注意：低版本的safetensors版本不兼容，在 Conda 环境中，路径类似。：打开该文件，确保其中包含了对。

2025-10-15 13:14:44 220

原创 Zotero安装以及扩展插件的配置保姆级教程

Zotero文献管理工具的安装与配置指南：介绍了Zotero软件的下载安装、WebDAV同步设置（与坚果云联动）、以及插件安装方法。重点包括自定义安装路径、Zotero Connector插件安装、坚果云账号配置实现文件同步，并通过中文社区下载安装实用插件（如划词翻译插件）。文章提供了详细的图文步骤指引，帮助用户快速掌握这款功能强大的文献管理工具的使用方法。

2025-09-29 10:59:52 1642

原创 Real-Time MDNet

（1）我们提出了一个快并且准确率高的跟踪算法——RT-MDNet，是基于多域卷积神经网络MDNet。该方法加速了特征提取过程，并且为示例分类，学习了更多的判别模型。它通过在每个激活中保持具有大感受野的高分辨率特征来增强目标和背景的表示质量。（2）引入了一个新的loss来区分多个领域的前景实例，并学习具有相似语义的目标队形的更具区分性的嵌入。与MDNet相比，RT-MDNet实现了大约25倍的加速，准确率几乎相同。

2025-09-24 22:18:46 945

原创吴恩达手撕Transformer视频笔记

编码器Encoder提供输入文本的丰富上下文关联；它处理完整的文本以提取语境信息；仅基于Encoder的模型例如，BERT模型和RAG（检索增强生成）中多数嵌入模型解码器Decoder执行文本生成任务输入提示生成内容是很多主流LLMs的基础架构，例如OpenAI,Cohere 和Meta.大语言模型的魔力来自于两个要素一是Transformer的架构本身，二是训练模型所使用的海量优质数据。

2025-08-02 00:07:09 653

原创 Win11教学视频学习小记

由于收到Win10今年某月就不在维修的消息，所以打算看看Win11系统做了哪些改变。找了一个B站的老师，顺便学习了一下操作系统的更新迭代过程。目前是感觉比较适合而且语速太慢了，建议拉到1.5 倍速看，就是正常语速了。而且觉得讲的是比较多，对于只想了解有哪些更新的人，该视频有一点冗余，所以我只看了前几个。

2025-07-31 16:06:10 420

原创讲的最清楚的Transformer视频！

b站-飞天闪客的《一小时从函数到Transformer!一路大白话彻底理解AI原理》视频学习小记真的就是在说人话，也没有过多的例子，让有一点数学基础的人可以一下子就听懂。

2025-07-29 11:43:51 660

原创学术论文的科研流程概述视频会议记录

提升代码能力：先明白基础的函数，可以复现一个网络。最好是实现一个操作系统。CCF-Talk SPP131期浙江大学研究员彭思达的报告。举例视频生成要多快好省。

2025-05-14 21:00:37 392

原创 ValueError: Decompressed Data Too Large 已解决

1、问DS之后，他说出现此错误的原因是处理PNG图片时，其内嵌的ICC配置文件（iCCP块）解压后数据过大，超过了Pillow库的安全限制。其实也对，但是他给的解决方案是让我用python移除ICC Profile,也折腾了一会儿。因为我的图像都是1024*1024的大小的。默认为 1MB，以防止解压缩炸弹。此外，所有文本块的总大小限制为。他给出的确切方法不是很适用，还是报错，试过的有。2、再就是github上的提问。单个压缩块的解压缩大小限制为。加在代码前面，值此问题解决。

2025-03-25 16:12:12 581

原创截图识别公式，SimpleTex好用

或者是选择打开Docx文档，他会谈出来一个文档，文档里会有一个公式，然后你直接复制粘贴就好了，这里不用选择只保留文本，而是直接ctrl c 和ctrl v 就好了。直接复制MathML,使用时候就是在word里右键黏贴里的。就可以直接在现有论文或者网页里面节选自己想要的公式。

2025-03-10 15:22:11 1268

原创清理C盘小记+微信QQ数据转移

键盘快捷键按下 Ctrl + A，然后右键点击删除，或者快捷shift + Delete。这个真的有效，因为我先用的上一步，发现没增加多少空间，把回收站里的东西一清理就腾出了8G的空间。突然C盘就爆满了，想当初还是给他预留了120G的空间，感觉到现在也不够用了，担心出现死机的情况就赶紧进行了清理。以为临时文件很多，兴致冲冲的打开，发现也没几个可以选的，没增加多少空间。右击C盘选择属性，点击磁盘清理，感觉也没有清理多少东西啦。在设置中点存储，选临时文件或清理建议，然后点击清理。

2024-12-18 21:01:35 533

原创 SAPGAN文献阅读笔记

判别器网络用于正确的预测这个输入的图像是真的还是假的，生成模型用于生成假的图像骗过判别器来愚弄判别器。基于GAN的条件模型称为Pix2Pix ,它表示了Image-to-image在成对数据的转换，并且广泛使用于edge-to-art 图像转换中。SAPGAN由两个GAN组成，SketchGAN用于生成edge maps，PaintGAN用于随后的edge到paintings的转换。作者是收到画师绘画步骤的启发，先进行素描，然后在素描上进行绘画，所以总的代码分为两个步骤。NVIDIA的sota。

2024-12-11 12:36:28 1070

原创 ViViD文献阅读&&代码复现

我也是通过这篇博客了解到了这个优秀的视频换装网络的。与中国科学技术大学联手推出了一款名为ViViD的新框架，旨在革新虚拟试衣体验。ViViD基于先进的扩散模型技术，能够实现视频中人物衣物的实时替换，从而生成自然且逼真的视频效果。ViViD的推出解决了以往视频试衣中难以保持时间一致性和图像质量的难题。它由三大核心构成:服装、姿势编码器以及时间模块。这些组件协同工作，不仅可以精确提取衣物细节的语义特征，还能对人物姿势进行编码，并确保整个视频在时间线上的连贯性。

2024-12-08 14:46:22 1118

原创用hfd工具快速下载huggingface模型权重记录

镜像站：https://hf-mirror.com/如果有权限问题加sudo。怕找不到了，做个记录。x为线程数，1-16。

2024-11-05 11:14:41 632

原创 Hallo2 音频驱动的长视频和高分辨率肖像图片动画论文阅读&&复现

VASA-1使用DiT作为扩散过程的一个降噪器。EMO代表了第一个端到端系统，该系统能够使用基于U-Net的扩散模型来进行生成。EchoMimicV-ExpressLoopyCyberHostHallo 使用分层音频驱动的视觉合成，实现了面部表情生成、头部姿势控制和个性化动作自定义本文的主要贡献：1、扩展了生成长视频的方法为了解决外观漂移和时间伪影（temporal artifacts）等重大挑战，作者研究了条件运动帧图像空间内的增强策略：一种。

2024-10-28 21:38:34 1185 1

原创学术规范与论文写作课程记录

我们考虑了xx系统中的xx问题，利用xx原理或xx方法研究这个问题，在研究过程中遇到了xx阻碍，然后又用到了什么特殊的手段解决了这个阻碍，最后达到了什么样的效果。列举谁的论文研究了同样的问题，提出了什么方法，达到了什么效，果然后画风一转，然而他们的工作还有什么缺点；另一个人又做了什么相关或者类似的问题采用了什么方法，达到了什么效果，然而他又有什么缺点；他们文章的缺点就是我们这篇文章要解决的重点。摘要引言的最后一部分和总结是很相似的。以完成了已经完成了所有工作的口气去写，用过去式。

2024-10-27 23:05:35 1489

原创生成.bin格式而不是.safetensors格式文件,styleshot调试小记

在复现styleshot的过程中发现训练完stage1之后生成的参数格式为.safetensors，但stage2所需要的格式为.bin，尝试过使用脚本把.safetensors转换成.bin，但是无法被stage2读取。最后将训练第一部分tutorial_train_styleshot_stage_1.py最后倒数第四行的代码。.safetensors是由 Hugging Face 推出的一种新型安全模型存储格式.

2024-10-23 17:08:50 519 2

原创安装LateX && 学习使用LateX

下载texlive,并查看是否安好按流程走就好参考网页。

2023-11-15 17:12:04 517

原创虚拟机安装tensorflow

这个很慢，不知道是不是网的原因，所以单独找的源。因为要换成python2.7所以重新创建环境。但是下载的是最新版本的tensorflow。之前弄错python版本的几步。，所以去搜索了一下对应版本。

2023-11-15 16:57:05 242

原创查看CUDA 和CUDANN版本

CUDAnvidia-smiCUDAnn。

2023-11-15 16:53:14 407

原创 win10：升级驱动&&安装anaconda&&CUDA&&pytorch，配置anaconda 和pytorch

1、先卸载之前CUDA的东西，进入任务面板进行卸载，保留如下的两个图标2、nvidia-smi查看自己的驱动版本3、进入NVIDIA官网根据自己的电脑情况填写：4、找到合适版本的驱动：5、安装驱动。

2023-11-15 16:51:53 236

原创 VS和CUDA示例运行报错：addKernel launch failed: no kernel image is available for execution on the device

参考的解决方案里说是因为，编译器中的算例设置与显卡算例不匹配。然后打开vs打开项目-项目属性-CUDA-Device。

2023-11-15 16:22:05 532

原创 RuntimeError: features must be contiguous

（x本身是contiguous的），就要。，让它的布局和从头创建的一模一样，所以我在这个变量后面加上了。

2023-11-03 23:09:16 419

原创运行ROI_align的setup.py build_ext --inplace 报错

把 AT_CHECK 改成 CHECK_CUDA。

2023-11-03 20:19:30 157

原创检测图像的通道数

如果输出3则为三通道，输出1为单通道。path = '图片路径'

2023-10-27 11:17:55 315

原创 Pycharm在Debug时,Tensor张量显示不全问题

来自：Pycharm在Debug时,Tensor张量显示不全问题_pycharm数据显示不全_Good@dz的博客-优快云博客

2023-10-23 22:15:51 333 1

原创 CUDA和GPU之间的版本对应关系

CUDA和GPU之间的版本对应关系 - 知乎

2023-10-08 21:45:54 266

原创 subprocess.CalledProcessError: Command ‘[‘ninja‘, ‘-v‘]‘ returned non-zero exit status 1.

将setup.py中的“cmdclass={'build_ext': BuildExtension}”这一行改为“cmdclass={'build_ext': BuildExtension.with_options(use_ninja=False)}”，解释为：pytorch默认使用ninjia作为backend，这里把它禁用掉就好了；第二个博客里说可以通过改系统文件来解决，评论区里也有没解决的。

2023-10-06 00:28:28 4706 6

原创 CUDA11.8下载torch

用官网的方法安装，验证torch.cuda.is_available()总是False.又说是因为官网上下载的总是cpu版本，还有说是因为cuda 的。

2023-10-05 22:28:07 805

原创 ubuntu安装microsoft edge

在这个页面，参考最下面的命令。

2023-10-04 22:57:53 787 1

原创 Ubuntu22.04安装cuDNN && Anaconda

-----------------------------------------------安装cuDNN--------------------------------------------------------------------------------------------------------------------------------安装Anaconda----------------------------------------------进入下载到的目录中，用。

2023-10-04 22:18:35 486 1

原创 Ubuntu 22.04安装中文搜狗输入法

记录一下参考：https://blog.youkuaiyun.com/Mr_Sudo/article/details/124874239

2023-10-04 21:25:33 527 1

原创 Ubuntu22.04 系统安装驱动 && CUDA11.8

------------------------------------------------安装驱动--------------------------------------------------------------------------------------------------------------------安装CUDA11.8-------------------------------------------------------------我的是关掉的，就没管。

2023-10-04 21:20:10 4074 2

原创 Ubuntu22.04 系统解决输入nvcc -V 显示sudo apt-get install nvidia-cuda-toolkit安装即CUDA环境配置问题

---------------------------------------------解决输入nvcc -V--------------------------------------------------------------------------------------------------Ubuntu20.04 系统安装CUDA12.2-----------------------------------------------3、然后配置普通用户的环境变量。

2023-09-20 23:07:57 5273 3

原创《python编程从入门到实践》第二版---读书笔记-——第一部分

列表是由一系列按特定顺序排列的元素组成。python中，用[ ]表示列表，并用分隔其中的元素。访问列表元素：列表是有序的集合，可用元素位置（索引）告诉python。索引是从0开始。trekTrek当索引指令为-1时，返回最后一个列表元素。同理-2为倒2，-3为倒3.while循环不断运行，直到指定的条件不满足为止。使用while循环12345让用户选择如何退出定义了一个退出值，只要用户输入的不是这个值，程序就将接着运行。

2023-08-26 20:08:55 630

原创 git使用方法

这时候你当前testgit目录下会多了一个.git的目录，这个目录是Git来跟踪管理版本的，没事千万不要手动乱改这个目录里面的文件，否则，会把git仓库给破坏了.先在GitHub种复制URL，然后再命令行窗口中输入“git clone”，粘贴URL，回车，等待下载完成。通过上面的显示我们可以知道，增加内容3333的版本号是 6fcfc89.我们现在可以命令。在命令行窗口输入“git init”，回车，此时刚创建文件夹中出现一个.git文件夹。，我想把当前的版本回退到上一个版本，要使用什么命令呢？

2023-07-14 16:01:21 120

原创 AICITY2023_track5 多目标跟踪YOLOV8+strongSORT，报错：RuntimeError: CUDA error: device-side assert triggered

不然会报错：RuntimeError: CUDA error: device-side assert triggered。注意：标签是从0开始，因为官方给的标签是从1开始的，所以要提前处理一下标签数据。这个bug主要是标签不匹配的原因，报错的地方未必是真正有问题的地方。

2023-07-14 15:39:52 767 3

原创将VISDRONE标签数据集转换成COCO格式+在MMdetection上训练

然后参考的使用指南的训练&测试中将 balloon dataset 转化为 COCO 格式的代码，可以将自己的代码转换成COCO格式。

2023-07-14 15:33:25 986

原创 MMdetection安装环境

我的是GPU所以用的是这个命令，中间尝试过安装别的版本的pytorch，但在mim安装东西的环节出现了错误，所以还是选择用官网给的流程一步一步进行。经常出现timeout的报错，不管，我就反复安装，总有一次能安上。

2023-06-12 19:08:25 298

空空如也

空空如也