自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(75)
  • 资源 (9)
  • 收藏
  • 关注

原创 【生成模型】【小实验】VAE的作用与Flux-Fill

或者参考官方代码:https://huggingface.co/black-forest-labs/FLUX.1-Fill-dev。可以看见其实diffusion输出的特征中视觉要素已经很明显了,VAE只是让它们看起更像是自然图像。

2025-03-11 12:57:23 159

原创 【生成模型】【ComfyUI(三)】使用WebAPI批量调用ComfyUI

可以参考中Flux-Fill部分。

2025-02-25 16:52:40 596

原创 【生成模型】【ComfyUI(二)】通过ComfyUI老版本(0.2.2)支持Flux-Fill了解ComfyUI的代码构成

ComfyUI代码了解

2025-02-25 12:43:20 407

原创 【生成模型】【理论基础(一)】基础知识

基础知识

2025-02-21 16:48:16 858

原创 【生成模型】【ComfyUI(一)】Flux与Flux-Fill部署与API调用

Flux与Flux-Fill在ComfyUI中的部署

2025-02-20 17:32:24 393

原创 【生成模型】Flux-Fill代码精读

flux fill代码精读

2025-02-12 11:30:57 874

原创 【大模型技术】accelerate和deepspeed

accelerate和deepspeed都是用于深度学习训练和推理加速的工具。

2025-02-10 12:01:19 1129

原创 【生成模型】Flux-Fill与量化

打印权重类型可以看到,只有transformer的weight是量化的uint8,因为不同类型的tensor是不能计算的,因此猜测应该是设置了GGUFQuantizationConfig(compute_dtype=torch.bfloat16),后,会在计算时候将uint8转为torch.bfloat16,然后计算,计算结果转回去或者保持torch.bfloat16,因此它的推理速度应该比原版还慢。BitsAndBytes慢的更多(不知道是不是和它是面向训练的有关)如果推理的图片是噪声,参考。

2025-01-23 12:06:11 1378

原创 【pytorch】DataLoader & Sampler的例子

【代码】【pytorch】DataLoader & Sampler的例子。

2025-01-12 11:15:13 121

原创 【大模型与AIGC】VLM基础知识汇总

当前的LLM模型往往采用CausalModel,它的mask构建如下,即计算Y[i]时不会有Q[i+t]/K[i+t]/V[i+t] (t>0)引入attention,Q[i]不会与K[i+t]/V[i+t]计算。通过上面的分析,可以知道,对于CausalModel的LLM,第t个词的结果在整过过程是不变的,且不依赖于后面时刻的输入,所以可以使用KV cache,把之前的结果缓存下来,只预测新的token的结果。input length 以及超出长度后如何处理。因此,很多代码是自己实现这个mask,以。

2024-09-03 14:45:40 1386

原创 [技术小技巧] 可视化分析:在jupyter中使用d3可视化树形结构

基于d3.js在jupyter中可视化树形结构数据

2024-04-29 20:45:38 573 1

原创 [目标检测] OCR: 文字检测、文字识别、text spotter

文字检测、识别、OCR数据集和方法调研

2024-04-10 17:51:18 1107

原创 【mmdetecion】DETR、DeformableDETR和DINO

fill:#333;color:#333;color:#333;fill:none;

2024-04-10 12:35:00 1250

原创 制作github个人主页

构建.github.io主页

2024-01-10 15:43:46 1013

原创 【mmdetection】ROIExtractor中的featmap_strides和finest_scale

也就是对于RCNN阶段,用来提取特征的特征层就是neck后给出的特征层的前len(self.featmap_strides)层x[:len(self.featmap_strides)],而起始层不受self.featmap_strides的控制(也没有其它参数控制),但self.featmap_strides会影响ROIAlign时候rois和特征图的尺度映射,从这个角度上说。为什么这个变量影响这么大,下面查看代码进行分析。通过对下面代码的分析,可以知道,在RCNN阶段。

2023-10-21 13:33:45 546

原创 [科研琐事] 安装服务器的二三事

宽度:一般机器都是符合的;深度:对应服务器最长的那个边;厚度(高度):1/2/3/4U,就是机柜上写的刻度数字,1U=1.75英寸。我们的2080/3090/4090服务器都是4U的。

2023-10-13 14:52:53 521

原创 【mmdetection】MaskRcnn中的mask是怎么输出的,是什么形式?

【代码】【mmdetection】MaskRcnn中的mask是怎么输出的,是什么形式?

2023-08-25 22:07:29 879

原创 VSCode配置(三)设置字体

vs code中有三个部分的字体设置。

2023-02-25 21:58:52 4932

原创 VSCode配置(二)Python

一个IDE的功能要具备如下安装以下插件:(如果是远程调试,则要安装在远程服务器上)

2023-02-25 21:50:17 492

原创 VSCode配置(一)Remote SSH

vscode 配置

2023-02-25 12:00:11 3089

原创 【Pytorch】自己的工具类:TensorList

【代码】【Pytorch】自己的工具类:TensorList。

2022-11-02 17:40:09 341

原创 Python 多进程编程(一)Pool & Manager in multiprocessing

multiprocessing中的Pool和Manager使用

2022-10-18 16:15:20 898

原创 Unity开发基础

unity开发的基础:IDE的配置

2022-10-06 11:41:08 1006

原创 [教学小东西][游戏][js] 修改js游戏的属性

html/js小游戏链接: 骑士进度条这是一个纯用html和js书写的游戏F12打开源码调试界面,由点击事件找到相关js文件浏览js在,找到游戏相关的全局变量可以从名字和初始值来确定coins: 金钱days: 年龄打开console,修改相关变量正常的话,年龄就被set了...

2022-05-13 14:41:27 6166

原创 声音编程(Voice Coding) Talon(一) 基本介绍与安装使用

语音编程平台简介语音编程工具有哪些:Talon是一款声音编程平台,它追求的意义在于完全取代键盘和鼠标。。当前,全球有两个领先的语音编程平台(Programming-By-Speech Platforms)。一是Serenade,它的作用有点像数字助手,可以让你描述正在编程的命令,而不要求你必须逐字逐句地口述每条指令。另一个就是Talon,它提供了对每一行代码更精细的控制,这也意味着你需要对每一个被编入机器的任务有更细致的把握。具体的差别可以参考文章末尾的Serenade 和 Talon编程的例子。除了这

2022-04-02 12:37:20 3560 1

原创 关于python函数参数的默认值是共享的这档子事。

In [3]: class T(object): ...: def __init__(self, d=dict(a='111')): ...: print(d.pop('a')) ...:In [4]: t1 = T()111In [5]: t2 = T()---------------------------------------------------------------------------KeyError

2022-02-08 14:46:09 774

原创 windows+cpp(四): vscode + Makefile开发cpp

准备gcc: 需要参考windows+cpp(二):安装cpp开发环境 MinGW 或 msys2 或 Cygwin 安装 MinGW 或 msys2 (推荐后者)vscode编写cpp的基本配置tasks.json, launch.json, .json, 可参考windows+cpp(三): VS code + MinGW, windows上编写调试cppMakefile创建一个main.cpp#include <iostream>int main(){ std:

2021-10-20 16:28:46 1496

原创 windows+cpp(二):安装cpp开发环境 MinGW 或 msys2 或 Cygwin

msys2适合开发者,因为它除了cpp开发环境,还有linux中的一些基本的命令比如mkdir/ls/rm等,此外还有一个package管理可以装很多包,因此可是更好的使用Makefile和CMake等大项目的开发工具。MinGW适合运行者和cpp初学者,里面只有基础的cpp开发环境。安装MinGW官网下载 MinGW并安装。在设置->高级系统设置->环境变量中给PATH添加上MinGW下的bin目录的路径,如D:\mingw-w64\mingw64\bin。打开cmd,输入g++

2021-10-20 15:05:31 7596

原创 windows+cpp(三): VS code + MinGW, windows上编写调试cpp

MinGW官网下载 MinGW并安装。在设置->高级系统设置->环境变量中给PATH添加上MinGW下的bin目录的路径,如D:\mingw-w64\mingw64\bin。打开cmd,输入g++ -v或gcc -v,如果有输出则配置成功。Using built-in specs.COLLECT_GCC=gcc......Thread model: posixgcc version 8.1.0 (x86_64-posix-seh-rev0, Built by MinGW-W64

2021-10-19 16:58:11 543

原创 windows+cpp(一): MinGW, MSYS32,Cygwin: windows下cpp开发环境的差异

#mermaid-svg-iFQrNevZYlNhH6fU .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-iFQrNevZYlNhH6fU .label text{fill:#333}#mermaid-svg-iFQrNevZYlNhH6fU .node rect,#mermaid-svg-iFQrNevZYl

2021-10-18 15:09:43 646

原创 DHCP重新分配ip

sudo dhclient -rsudo dhclient # 重新连接网络...

2021-09-11 17:31:32 1594

原创 mmdetection代码阅读系列(六):BaseModule的初始化

BaseModule初始化的参数init_cfg例子如下dict( type='Normal', layer='Conv2d', std=0.01, override=dict( type='Normal', name='conv_cls', std=0.01, bias_prob=0.01))type: (str) 用于初始化的INITIALIZERS的namelayer:(list[str], st

2021-08-25 18:07:05 2408

原创 pytorch torch: slice赋值以及clone不会截断梯度

新开内存建一个tensor b,将已有tensor a的值赋值给b[1:],此时对b的梯度能不能回传到a上?答案是可以。下面的前两个输出表明赋值是深拷贝,不是浅拷贝。a,b是两个不同的内存最后两个输出表明,b不被重新赋值的部分能够将梯度反传回a。import torcha = torch.tensor([1, 2, 3]).float()a.requires_grad_()b = a.new_full((4,), 0)b[[1, 2, 3]] = a # 这里写 b[[1, 2,

2021-08-22 19:55:38 2818

原创 矩阵计算代码: np.meshgrid & DeformConv2d

meshgridimport numpy as npX = np.arange(1, 4)Y = np.arange(11, 13)# MX.shape=MY.shape=(len(Y), len(X))=(H,W)MX, MY = np.meshgrid(X, Y)print(MX)print(MY)MP = np.stack([MX, MY], axis=-1)[[1 2 3] [1 2 3]][[11 11 11] [12 12 12]]MP: (x0, y0) (x

2021-08-11 16:34:18 893

原创 mmdetection代码阅读系列(五):流程图

#mermaid-svg-aIWWQXuT8tTeVJfB .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-aIWWQXuT8tTeVJfB .label text{fill:#333}#mermaid-svg-aIWWQXuT8tTeVJfB .node rect,#mermaid-svg-aIWWQXuT8t

2021-08-10 18:04:47 264

原创 mmdetection代码阅读系列(四):RepPoint代码阅读(下)RepPointsHead

需要实现的函数:forward, loss, get_bboxesRepPointsHead的继承关系如下#mermaid-svg-CwHHxqLNh6uZ4nPe .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-CwHHxqLNh6uZ4nPe .label text{fill:#333}#mermaid-

2021-08-06 00:12:12 726

原创 mmdetection代码阅读系列(四):RepPoint代码阅读(中)AnchorFreeHead

Head#mermaid-svg-dJXd4zNUVtPftPjr .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-dJXd4zNUVtPftPjr .label text{fill:#333}#mermaid-svg-dJXd4zNUVtPftPjr .node rect,#mermaid-svg-dJXd4

2021-08-05 17:24:03 816

原创 mmdetection代码阅读系列(四):RepPoint代码阅读(上)RepPointsDetector

继承关系#mermaid-svg-ECqUgqSfEtxV0ian .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-ECqUgqSfEtxV0ian .label text{fill:#333}#mermaid-svg-ECqUgqSfEtxV0ian .node rect,#mermaid-svg-ECqUg

2021-08-05 17:14:17 886

原创 mmdetection代码阅读系列(三):整个代码训练的流程 build_from_cfg, Runner, Hook

tools/train.py:main train_detector( model, datasets, cfg, distributed=distributed, validate=(not args.no_validate), timestamp=timestamp, meta=meta) runner.run(data_loaders, cfg.workflow)

2021-08-03 16:56:52 1785

原创 mmdetection代码阅读系列(二):Decorators in mmdetection, Registry工厂模式

在mmdetection中大量使用了如下的decorator(其本质是一种工厂模式),本文详细介绍这种模式from ..builder import HEADS@HEADS.register_module()class RepPointLocHead(AnchorFreeHead): ...RegistryRegistry就是类似工厂模式的Manager,有两个作用:注册(register):记录对象名字到对象class的映射创建(build) :根据配置信息中给出的名字的参数创建

2021-07-20 17:55:39 520

python2 编码问题的测试代码

使用python进行中文字符处理时总会出现乱码问题,这个例子用与说明python的编码转换过程很常见的5个问题

2016-07-31

python编码问题的测试代码

使用python进行中文字符处理时总会出现乱码问题,这个例子用与说明python的编码转换过程很常见的3个问题

2016-07-30

indigo studio注册机

indigo studio的注册机,可以生成indigo studio2 和indigo studio3的激活码

2015-12-04

freeglut预编译版(头文件+lib+dll)

因为freeglut3.0之后没有再直接提供预编译版本的lib和dll,这是一个已经经过cmake编译好的windows平台下的freeglut的预编译内容,包含头文件,lib和dll,有debug版本和release版本两种

2015-12-03

sources.list 64bit

64bit Ubuntu 使用的apt-get update要用的sources.list文件

2015-10-24

xv6 + qemu 在 ubuntu下的安装说明

xv6在ubuntu下编译并运行在qemu的教程

2015-10-21

qemu2.4.0.1

qemu是一个虚拟机,可用来运行xv6系统

2015-10-21

xv6 源代码

xv6是MIT写的一个微linux,可以用来学习操作系统

2015-10-21

ubuntu 的 apt-get update 需要的sources.list

apt-get update 命令所需的下载源 用它替换/ect/apt/sources.list

2015-10-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除