自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(67)
  • 收藏
  • 关注

原创 【bug解决】NameError: name ‘fused_act_ext‘ is not defined

使用basicsr库做超分的时候发现这个问题,一直不断重复的使用和发现一直没有执行编译过程,导致一直推理失败。

2025-03-28 20:27:24 172

原创 【工具】huggingface 模型下载过程

记录下自己下载模型的几种方式。

2025-03-17 23:54:26 368

原创 【论文精读】FaceMe:第一个利用扩散先验且不需要微调的个性化人脸修复算法

人脸恢复算法存在三个约束,一致性(Consistency)、真实性(Realness)、ID一致性(Identity Consistency)。第一个利用扩散先验且改变人脸身份的时候不需要微调的个性化人脸修复算法

2025-03-17 23:46:55 784

原创 【bug解决】FaceDetection = face_alignment.FaceAlignment(face_alignment.LandmarksType._2D, device=device)

在使用face_alignment库的使用发现没有_2D这个属性,报错如下。

2025-03-15 23:10:58 205

原创 【论文精读】DifFace: Blind Face Restoration with Diffused Error Contraction

这篇文章是被 2024 TPAMI接收的关于人脸修复(`face restoration`)方向的论文,该论文设计中间转移过程,将低质量图像LQ转到中间态,然后利用预训练扩散模型的反向过程恢复到清晰的图像。

2025-03-15 23:03:23 1280

原创 【原理理解】图像SNR信噪比理解

从光学成像的方向入手,传感器(sensor)接收通过镜头的光信号,并将其转化为电信号,然后再经过量化,将模拟信号转化为数字信号,最终变成图像原始的RAW信号,RAW信号其实应该是用拜尔阵列得到的RGGB or BGGR,再经过去马赛克、白平衡等操作就变成我们熟悉的RGB图像。信噪比,顾名思义,就是信号和噪声的比较,网上有许多关于这方面的知识内容,给的公式并不一致,搞的我最近在分析电子放大噪声的时候有点迷茫,感觉大家都说的有道理,但是又不太相信,因为各说各话,也没有任何引用。

2025-03-10 20:13:24 508

原创 【bug解决】ERROR: Failed building wheel for mpi4py

建环境的时候安装mpi4py,可能会出现这个问题。特别如果是使用的时候。

2025-03-10 19:32:32 307

原创 [代码调试]安装Text2Image(stable diffusion)模型环境的踩坑记录

stable diffusion 环境配置

2025-02-18 11:36:28 487

原创 [论文阅读] SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution

SeeSR提出高质量提示词,充分挖掘T2I模型潜力

2025-02-17 20:26:19 883 1

原创 【代码实现】torch实现F.pixel_shuffle和F.pixel_unshuffle

pixel_shuffle 和 pixel_unshuffle 常用于神经网络减少特征图尺寸以减少计算量,,可以根据原理使用torch实现。

2024-09-30 18:27:41 593

原创 【代码实现】opencv 高斯模糊和pytorch 高斯模糊

Gaussian Blur,也叫高斯平滑,是在Adobe Photoshop、GIMP以及Paint.NET等图像处理软件中广泛使用的处理效果,通常用它来减少图像噪声以及降低细节层次。

2024-09-30 17:51:51 1342 1

原创 [原理理解] Swin Transformer相对位置编码理解

现在,我们想要获取非负数的位置索引,怎么做呢?首先我们需要先知道相对位置最小,最大值是多少?最大值就是当前像素是第一个像素的时候最后一个像素的位置;最小值就是当前像素是最后一个像素时候第一个像素的位置;因此,对负数进行偏移需要X、Y 各自加上。现在,我们已经获取到非负的xy相对位置索引,需要做最后一个步骤,把两个索引映射成单一的维度的索引。能想到的最简单方式就是x+y,但是这个方式是不行的。如下图所示,如果直接两者相加,那么针对同一个像素,其他像素跟他的相对位置索引就会重复。

2024-08-27 20:28:38 1853

原创 [论文精读] StyleGAN2 论文&代码理解 (下)

这是StyleGAN2理解的下篇,主要讲述的是代码的理解。代码主要需要分为3个大方面来理解(1)、Generator网络结构(2)、主网络训练。(3)、图像投影到隐码空间 (latent space)的训练

2024-08-04 15:54:21 1336 2

原创 [论文精读] StyleGAN2 论文&代码理解 (上)

精读这篇文章的原来还是来自于一些工作中的启发,人脸修复算法(face restoration)效果较好的基于可以分为3个流派,一种基于stylegan先验的GFPGAN、GPEN等,另外两种分别是基于transform和diffusion。而基于stylegan的方式通常都是采用 stylegan2。所以有必要熟悉一下stylegan2。

2024-08-04 11:50:07 2239

原创 [原理] 可变性卷积(deformable convolution)原理及代码解释

代码见:https://github.com/4uiiurz1/pytorch-deform-conv-v2/blob/master/deform_conv_v2.py论文:https://arxiv.org/abs/1703.06211。

2024-07-28 18:37:23 1005

原创 [工具]GitHub + PicGo 搭建免费博客图床

如果上传失败,可能是自己使用了梯子(你懂的,GitHub一般都要用,不然很慢),需要电脑找下端口和代理,填写相关信息。还是觉得个人博客记录最好还是不要money😥,所以还是想白嫖,找到了GitHub + PicGO的方式,记录一下。,和搭建博客一样,在用户界面填写下自己仓库和token信息,并设置为默认图床。类似,新建仓库存储图片 + 使用token管理仓库权限,用其他软件操作导入。新建仓库用来存储博客照片。下载安装picgo@

2024-07-28 14:42:41 276

原创 [工具] GitHub+Gridea+GitTalk 搭建个人免费博客

GitHub 可以用来创建 [用户名.github.io] 的个人主页,如果是学者,那这个主页应该是用来介绍自己的各种著作,自己的个人经历。这个分为开源和闭源的,开源的现在基本不更新了(毕竟人家要赚钱),但是感觉开源的也还行,可以用用看。想要搭建自己的博客网站,又不想花钱买域名,也不会前端技术,只能求助于简单(傻逼式)且免费的博客搭建方式。1、新建个人仓库,仓库名设置为[用户名.github.io] ,如下图所示,已经设置过了,所以显示重复。软件界面远程设置一下,按照下图设置自己的仓库就行。

2024-07-28 13:22:52 355

原创 【linux】自定义快捷命令/脚本

使用别名(alias)或自定义脚本来创建快捷指令。b. 在文件中添加别名定义。例如,创建一个名为mmagic的别名,将其映射到命令:c. 保存文件并退出编辑器。直接切换了b. 在脚本中编写您想要执行的命令或命令序列。" ls -lc. 保存文件并退出编辑器。直接运行myscript.sh可以执行脚本中定义的命令。

2024-05-30 17:41:02 1117

原创 【linux】chmod权限开放(整个文件夹)

前面第一个rwx 是针对所有者,也就是本人,拥有r(read读), w(write写),x(?chmod a+rwx 其实相当于 chmod 777。三个rwx分别属于user,group,others。第三个 r-x 是针对其他人,拥有执行和读的权限。想要共享conda环境给同事,发现同事没权限。由于同事是组内人,想给他写的权限,本来只要执行。第二个 r-x 是针对组,拥有执行和读的权限。就行,但是发现还是复制不了,发现这个是文件夹,要使用递归。,满足所有子文件都能读写操作。

2024-04-23 20:25:54 1668

原创 【python】 numpy 中常用随机数函数的使用和记忆(不易混淆)

在使用numpy生成随机数过程中,通常有多个函数,容易混乱使用,也不知道哪些要加括号,哪些不需要加括号。本文主要总结使用过程中常用随机数生成的一些函数。包括这些函数的使用。

2024-04-14 17:55:20 1673

原创 【python、opencv】opencv仿射变换原理及代码实现

仿射变换是opencv的基本知识点,主要目的是将原始图片经过仿射变换矩阵,平移、缩放、旋转成目标图像。原始图像3个点为src,变换后的3个点名为dst,从数字也能看出来,这个变换就是x,y缩小一半。borderMode (可选): 边界模式,用于处理超出边界的像素。其中x,y是原始图像坐标,u,v是变换后的图像坐标。borderValue (可选): 当使用常量填充时的边界值,默认为 0。dst (可选): 输出图像,可以是预先创建的空白图像。3点法,也叫方程法,通过不共线的3个点确定仿射变换矩阵。

2023-12-07 20:53:53 1031

原创 【ffmpeg】视频常用操作合集

从1.yuv文件中抽取640*360尺寸的图片,储存在out文件夹中,名字按照0001.png ,0002.png 递增。yuv数据必须指定尺寸,因为他是源数据,没有行列概念。将640*360的源yuv数据1.yuv转为1.MP4。文件夹及文件名: 例如:2-5/%04d.png。1920是开始的列,920是总的提取多少列。尺寸 : 例如 :640x360。视频源:例如: test.yuv。内容写上需要合并的视频名称。

2023-12-05 20:24:53 1014

原创 【python】pip install 国内源

python很多库都需要用国内镜像才能比较快,常用的有临时换源或长久换源。在用户主目录加上一个pip文件夹,里面增加一个pip.ini文件,例如。国内源常用的有以下几种。home下创建.pip。

2023-12-05 20:07:25 915

原创 【pytorch】从yolo的make_grid理解torch.meshgrid、torch.stack

w=3,h=6对应的值就是[6,3]也就是第6行,第3列。torch.meshgrid 是 PyTorch 中的一个函数,这个函数通常用于创建坐标点的网格,以便进行一些网格上的操作,比如插值或者计算函数值。torch.stack((xv, yv), 2)就是将上述行列坐标信息堆叠在第2个维度,这样子每个位置就有各自的行列坐标值。可以看到yv实际上是一个纵坐标的网格,每个值都代表着自己所在的行,分别对应0-3行。可以看到w=1,h=2对应的值就是[2,1]也就是第2行,第1列。创建网格代码如下,那么什么是。

2023-11-28 20:33:27 1240 2

原创 【Python】np.unique() 介绍与使用

在 numpy.unique 函数中,axis 参数用于指定在哪个轴上执行操作,但在默认情况下,该参数通常是 None,表示在整个数组上执行操作。在很多情况下,我们不需要设置 axis 参数,因为默认值已经能够满足大多数需求。如果你的输入数组是多维的,而且你想在特定轴上找到唯一元素,那么你可以指定 axis 参数。# 在轴 0 上找到唯一元素# 在轴 1 上找到唯一元素输出。

2023-11-23 20:34:57 2616

原创 【pytorch】中gather函数的理解

如果指定dim=0,则index里面的数不能超过1,指定dim=1,则index不能超过2,指定dim=3,则index不能超过4。针对a[0]或者a[1] , 在高度维度H上,分别是3行,a[0][0:2] a[1][0:2]。例如在第b[0,1,2]的位置,则选择a[0][index[0,1,2]][2]的值进行代替即可。因此,如果选择dim=1,则index 张量里面的数必须在0-2之间,不然会越界,此时,第一个维度C是不会改变的,还是存在两个通道C,分别是a[0]和a[1],

2023-11-21 20:28:04 810

转载 【linux】跨服务器复制anaconda的环境(直接复制无需重复安装包)

跨服务器复制anaconda环境

2023-10-11 16:35:27 756

转载 【python】 @property属性详解

python@property详解

2023-09-19 16:11:55 11759 8

转载 【python】__init__.py的用法

__init__.py学习理解

2023-09-19 15:25:06 3513

原创 深度学习归一化原理及代码实现(BatchNorm2d,LayerNorm,InstanceNorm,GroupNorm)

本文记录总结pytorch中四种归一化方式的原理以及实现方式。方便后续理解和使用。

2023-09-18 19:27:25 2303 2

原创 【论文阅读】2020ECCV-DFDNet

2020ECCV-DFDNet 人脸修复(Face restoration)

2023-07-20 14:15:34 573

原创 【调试】MNN库编译踩坑记录

● 32位编译:在设置中找到vcvarsamd64_x86.bat(VS 2017的 x64_x86 交叉工具命令提示符)并单击,打开VS交叉编译x86架构程序的虚拟环境。● 64位编译:在设置中找到vcvars64.bat(适用于 VS 2017 的 x64 本机工具命令提示)并单击,打开VS编译x64架构程序的虚拟环境。直接编译debugx64,出现MTd MDd不匹配情况,根据提示,将libprotobuf》属性》C++》代码生成-》运行库改为MDd。继续区域换成中国,尝试ninja编译,成功。

2023-07-13 19:16:49 524

原创 【论文阅读】StyleganV1 算法理解

Styleganv1算法理解

2023-07-04 09:47:13 1389

原创 【调试】vscode远程连接服务器

windows远程连接linux服务器进行操作,有多种方式。可以借助ssh客户端,MobaXtermfinalshell等,这两个我觉得是不错的软件。当然如果需要在服务器编写代码,我还是建议使用vscode这个神奇的工具。怎么用vscode远程连接服务器代码呢?

2023-07-03 16:14:52 742 1

原创 【pytorch,onnx,bug解决】pytorch的op:pixel unshuffle转到onnx的op:SpaceToDepth

pytorch的`F.pixel_unshuffle` 转onnx 的 `SpaceToDepth`,

2023-06-28 17:38:33 1961 3

原创 【linux】一些linux系统下的常用命令(本地使用、远程服务器连接常用)

一些linux系统下的个人常用命令

2023-06-27 20:28:13 803

原创 【git】git常用指令(项目一般使用流程示例)

本文记录github/gitlab上的项目怎么拉到本地、增加开发分支、合并主分支、推到仓库等过程。

2023-06-26 20:24:21 1362

原创 【GAN】GANLoss之‘vanilla‘, ‘lsgan‘, ‘wgan‘, ‘hinge‘的具体计算方式及实现

由于在实际使用中遇到了多种形式的GANLoss,就整理了以下常用的四种GANLoss在应用中的区别,包括'vanilla', 'lsgan', 'wgan', 'hinge'。

2023-06-26 10:53:43 3445

原创 【bug】vscode python 3.6 无法debug 解决方案

解决vscode的python3.6调试问题

2023-06-19 15:37:28 2561

原创 【linux】opencv修改摄像头分辨率

解决linux系统下调用opencv修改摄像头分辨率,一直修改不成功的问题。

2023-06-19 15:21:18 3073

python+opencv 读取webcamera,并显示

python+opencv 读取网络摄像头、usbcamera等,并显示

2023-07-14

find-avaGPU.py

使用python,自动寻找服务器中显存最大的GPU进行pytorch推理,避免显存不够导致的推理失败。

2023-05-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除