- 博客(44)
- 收藏
- 关注
原创 使用fastapi部署stable diffusion模型
使用vscode运行stable diffusion模型,每次加载模型都需要10+分钟,为算法及prompt调试带来了极大麻烦。使用jupyter解决自然是一个比较好的方案,但如果jupyter由于种种原因不能使用时,fastapi无疑成为了一个很好的选择。
2025-03-18 10:33:56
286
原创 ValueError: PEFT backend is required for this method【已解决】
【代码】ValueError: PEFT backend is required for this method【已解决】
2025-03-17 19:19:28
116
原创 解决diffusers加载stablediffusion模型,输入prompt总是报错token数超出clip最大长度限制
解决token超出clip最大长度限制问题
2025-03-17 14:44:11
2984
原创 梯度传递不成功 | RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn
参考链接可解决。
2025-02-18 10:27:25
136
原创 2022ACMToG | 寻找快速的去马赛克算法
本文提出了一种方法,用于在给定损失函数和训练数据的情况下,自动合成高效且高质量的去马赛克算法,涵盖各种计算开销。
2025-02-04 19:03:26
956
原创 对象调用成员函数返回None——竟是因为没有该函数!
但是,在调试isp相关代码的时候,某个同门把reset()挪到了ISP_Environment类外面,在DRL/utils.py里面调用。竟然得到的是None!
2024-12-10 12:33:07
117
转载 cv2读取图片为BGR转化为RGB
转载:https://blog.youkuaiyun.com/Katherine1999/article/details/116059204。两种方法,已经测试读取的数组一模一样。
2024-11-13 22:16:20
271
原创 【PIL】PIL.Image和Torch.tensor之间互相转换
以后千万不要直接了。打个比方,numpy是游戏a中的人(cpu上用的比较多),tensor是游戏b中的人(gpu上用的比较多),物理世界中人这个本体(Image)可以分别映射到游戏a和游戏b。但你不能说我苦茶一下,b就等于torch.tensor(a)了,这不对,两者的映射关系应该以物理世界的人为基础。因此映射关系是复杂的,所以游戏a中的人在transforms.ToTensor()的参与下才能成功映射到b。
2024-11-11 21:17:47
580
原创 实验室集群服务器常用命令-Linux
a. --kill某个用户下的所有进程(用户为test)查看当前文件夹下所有文件(包括隐藏文件。b. 查看占用内存最大的10个进程。a. 查看服务器剩余内存。
2024-11-11 12:22:33
353
原创 2024 ECCV | DualDn: 通过可微ISP进行双域去噪
图像去噪是相机ISP (Image Signal Processing)管道中的重要组成部分。把去噪器直接用于捕捉的raw帧图raw域)或者把去噪器用于ISP输出的RGB图像sRGB域然而,两类方法都有局限。raw域去噪后的残留噪声会被ISP管道随后的处理模块放大;在sRGB域很难处理随空间位置变换的噪声,因为在该域中只能看到被ISP扭曲过的噪声(噪声变得复合了)。因此,大多数raw/sRGB域去噪的工作仅适用于特定的噪声分布和ISP配置。为了解决这个问题,本文提出了DualDN。
2024-11-09 23:47:25
1322
原创 2024AAAI | DiffRAW: 利用扩散模型从手机RAW图生成单反相机质量的RGB图像
由于明显的细节差异(discernible detail disparity)不稳定的颜色映射关系和RAW-sRGB pair的空间尺寸不对齐从智能手机RAW图推导出数码单反相机(DSLR,Digital Signal Lens Reflex Camera)质量的RGB图像已经成为了一个很吸引人的挑战。本文提出了DiffRAW,一个第一次把扩散模型用于学习RAW-to-sRGB映射的新颖的方法。本方法利用扩散模型学习到了DSLR图像的高质量细节分布,进而增强了输出图像的细节。同时,本文。
2024-11-09 11:14:04
1216
原创 2024IJCAI | MetalISP: 仅用1M参数的RAW到RGB高效映射模型
SOTA的深度ISP模型通过增加网络的尺寸和复杂性缓解了对不同异质输入的有限泛化能力问题,但也不可避免地导致了网络参数量和FLOPs的急剧增长。为了解决这个问题,本文提出了MetaISP,一个通过"针对不同输入自适应调整参数和结构"以达到优越的图像重构质量的模型。我们的理论主要涉及为不同的输入生成对应的空间/通道注意力矫正矩阵,以帮助分配注意力(即模型应更关注图像的哪些部分)。我们通过“为每张输入图像预测动态权重并把权重与多个可学习的基础矩阵相结合以构建矫正矩阵“的方法实现上述理论。
2024-11-09 10:38:59
816
原创 2024NIPS | AdaptiveISP: 针对目标检测任务学习一个自适应的图像信号处理器
图像信号处理器 (ISP, Image Signal Processor)的功能是把raw感知信号转换为数码图像,该芯片显著影响了图像质量和下游计算机视觉任务的表现。设计ISP管道和调优ISP参数是构建成像和视觉系统的两个关键步骤。为了找到最优的ISP参数配置,最近的工作使用深度神经网络作为ISP代理以搜索ISP参数或ISP管道。然而,这些方法的设计目的是最大化图像质量,而不是提高生成图像在high-level计算机视觉任务(例如:检测、识别、跟踪) 中的表现。除此以外,在推理阶段,
2024-11-04 17:34:15
1320
转载 python中的可迭代对象
转载于:https://www.cnblogs.com/LaoYuanPython/p/11144519.htmlPython中可迭代对象(Iterable)并不是指某种具体的数据类型,它是指存储了元素的一个容器对象,且容器中的元素可以通过__iter__( )方法或__getitem__( )方法访问。__iter__方法的作用是让对象可以用for … in循环遍历,getitem( )方法是让对象可以通过“实例名[index]”的方式访问实例中的元素。老猿认为这两个方法的目的是Python实现一个
2022-03-24 12:09:27
2622
原创 GPU和cuda的区别
声明本文内容部分摘自其它博主原文链接如下:https://blog.youkuaiyun.com/zhu_wendao/article/details/97759219引言在进行神经网络编程的时候,总是看到代码里有cuda字样,听到很多人说那是gpu,但是为什么不直接叫gpu呢?于是自己多方查找,得到了以下结论。结果梳理首先,我们需要知道的是,gpu是显卡中间的一块芯片。显卡就是一块大板子。其次,cuda是通用并行计算架构。过去GPU是做图形渲染工作的,因此像浮点数运算这种工作要想用GPU完成就得先将它“
2022-01-20 19:46:39
7485
原创 安装pytorch库的时候踩过的坑
千万不要直接pip pytorch因为自己之前安装库都是直接pip xxx,所以安装pytorch也想当然的这么以为,但是其实最正确的方法还是登录pytorch官网。点击相关按键,官网会给出对应语句。
2022-01-20 13:36:25
1004
原创 对Fast R-CNN指出Spp-net不能fine tune的一些理解
为什么Rbg大神认为对RCNN改进的Spp-net存在不能fine-tune的缺点呢?主要是Spp-net网络如果对fc层前的网络进行bp,那会存在巨大的计算灾难。
2021-12-14 00:01:21
459
原创 SVM进行人脸检测
通过feature.hog函数生成face_feature和hog_image,图片如下:使用特定大小的窗口进行滑窗,完成Sliding_window函数,主要思路是先将原有图片进行填充,然后建立二重循环,计算每一个点的hog_score,完成response_map的建立,通过resize函数将response_map缩放到image大小,完成准备工作,开始测试,图片如下:然而,我们发现,缩放比例后,再次调用Sliding_window函数,目标检测效果达不到我们的预期,偏差较大:于是我们提
2021-05-13 12:00:12
389
1
原创 图像去噪(包含修正的阿尔法均值滤波及通用滤波方法代码)
原理高斯噪声高斯噪声是指它的概率密度函数服从高斯分布(即正态分布)的一类噪声。如果一个噪声,它的幅度分布服从高斯分布,而它的功率谱密度又是均匀分布的,则称它为高斯白噪声。高斯白噪声的二阶矩不相关,一阶矩为常数,是指先后信号在时间上的相关性。高斯白噪声包括热噪声和散粒噪声。在通信信道测试和建模中,高斯噪声被用作加性白噪声以产生加性白高斯噪声。椒盐噪声椒盐噪声也称为脉冲噪声,是图像中经常见到的一种噪声,它是一种随机出现的白点或者黑点,可能是亮的区域有黑色像素或是在暗的区域有白色像素(或是两者皆有)。盐
2021-05-13 11:40:18
2605
1
原创 数字图像处理总复习
本学期选修了数字图像处理课程,下午考试,现就课程内容尽力总结。需要注意的是,本文章仅对课程大纲有一个概要性的描述,目的是为了同学们有一个系统性的知识结构体系,具体细节无暇书写。本课程将数字图像处理分为了四个模块:图像增强;图像复原;图像压缩;图像分割;图像增强和图像复原的输入输出都是图像。而图像压缩的输入为图像,输出为编码。图像分割的输入为图像,输出为同质区域。下面尽可能详细阐述各个模块。图像处理总复习图像增强空域处理点处理灰度变换直方图处理邻域处理频域处理傅里叶变换图像复原图像压
2021-04-29 11:44:08
315
转载 matlab中uint8,double,im2double和im2uint8的区别
【转载】原文传送门:https://blog.youkuaiyun.com/fx677588/article/details/53301740matlab图像保存说明 matlab中读取图片后保存的数据是uint8类型(8位无符号整数,即1个字节),以此方式存储的图像称作8位图像,好处相比较默认matlab数据类型双精度浮点double(64位,8个字节),自然可以节省很大一部分存储空间。 详细来说imread把灰度图像存入一个8位矩阵,当为RGB图像时,就存入8位RGB矩阵中。例如,彩色图像像素大小是4
2021-04-03 22:55:12
4713
1
原创 行阶梯型矩阵
行阶梯型矩阵若有零行,全在下方除全零行,从行上看,自左起出现连续零的个数自上向下严格单增行最简阶梯型矩阵满足行阶梯型矩阵条件台角元素为1台角正上方元素全为零
2021-03-30 23:12:57
7060
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人