自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 问答 (1)
  • 收藏
  • 关注

原创 Flash Diffusion Accelerating Any Conditional Diffusion Model for Few Steps Image Generation

《闪光扩散:加速任何条件扩散模型的几步图像生成》提出了一种高效的蒸馏方法,显著加速了预训练扩散模型的图像生成过程。该方法在COCO2014和COCO2017数据集上实现了最先进的性能,仅需少量GPU小时训练和更少的可训练参数。其创新点包括与LoRA兼容的蒸馏方法、大幅减少采样步骤、以及广泛的任务和模型架构适应性。实验结果显示,该方法在文本到图像生成、图像修复、超分辨率和人脸交换等任务中均表现出色,生成图像质量高且与输入条件匹配度好。此外,该方法训练效率高,资源消耗低,为扩散模型的广泛应用提供了有力支持。

2025-05-15 15:16:06 1771

原创 Fine-Tuning Image Conditional Diffusion Models is Easier than you Think

利用扩散模型对生成图像的深度图和法线图,修改了marigold推理中噪声输入和时间步长不匹配的问题,极大的提高推理速度

2025-05-09 13:29:57 652

原创 SINE (SINgle Image Editing with Text-to-Image Diffusion Models) 单图像编辑与文生图扩散模型

SINE (SINgle Image Editing with Text-to-Image Diffusion Models)论文学习

2025-05-08 09:38:53 2018

原创 SinGAN: Learning a Generative Model from a Single Natural Image

我们引入了SinGAN,一个可以从单个自然图像中学习的无条件生成模型。我们的模型被训练来捕捉图像中补丁的内部分布,然后能够生成高质量的、不同的样本,这些样本携带与图像相同的视觉内容。SinGAN包含一个金字塔式的全卷积gan,每个gan负责学习图像不同尺度上的patch分布。这允许生成任意大小和宽高比的新样本,这些样本具有显著的可变性,但同时保持了训练图像的全局结构和精细纹理。与以前的单图像GAN方案相比,我们的方法不仅限于纹理图像,而且不是有条件的(即它从噪声中生成样本)。

2025-04-29 15:14:07 611

原创 SinDDM: A Single Image Denoising Diffusion Model

去噪扩散模型(DDMs)在图像生成、编辑和恢复方面带来了惊人的性能飞跃。然而,现有的ddm使用非常大的数据集进行训练。在这里,我们介绍了一个在单个图像上训练DDM的框架。该方法采用多尺度扩散过程学习训练图像的内部统计信息。为了驱动反向扩散过程,我们使用全卷积轻量级去噪器,该去噪器以噪声水平和尺度为条件。这种架构允许以一种从粗到精的方式生成任意维度的样本。正如我们所说明的,SinDDM生成各种高质量的样本,并适用于广泛的任务,包括样式转移和协调。此外,它可以很容易地引导外部监督。

2025-04-16 20:48:53 722

原创 U-net模型和生成对抗网络GAN模型了解

激活函数不是用来激活什么,而是把并映射到对应的分类标签上个人理解就是一个二极管,用来对数据进行分类把大于0的数据都保留,而小于0的数据直接清零。

2025-04-02 21:19:46 2069

原创 Pixel2Pixel_A_Pixelwise_Approach_for_Zero-Shot_Single_Image_Denoising

多个卷积层,特征图数量逐渐增加(64→128→256→512),卷积核大小为3x3,步长为2(用于下采样),后面跟着批量归一化和Leaky ReLU激活函数。大多数基于无监督深度学习的去噪方法,包括自监督和零采样方法,都依赖于一个共同的假设,即图像中的噪声是像素独立的。:使用9x9的卷积核,3个特征图(对于RGB图像),步长为1,输出高分辨率(SR)图像。:卷积层,使用9x9的卷积核,64个特征图,步长为1,后面跟着PReLU激活函数。零均值噪声图片是指图片中的噪声具有零均值的特性,即噪声的平均值为零。

2025-03-26 20:41:22 876

原创 java知识学习

寻找解决问题的工具,并使用它解决问题,面向是工具,对象是问题钉钉子(问题) 找锤子(工具)==》解决。

2024-09-28 17:48:34 759 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除