- 博客(8)
- 问答 (1)
- 收藏
- 关注
原创 Flash Diffusion Accelerating Any Conditional Diffusion Model for Few Steps Image Generation
《闪光扩散:加速任何条件扩散模型的几步图像生成》提出了一种高效的蒸馏方法,显著加速了预训练扩散模型的图像生成过程。该方法在COCO2014和COCO2017数据集上实现了最先进的性能,仅需少量GPU小时训练和更少的可训练参数。其创新点包括与LoRA兼容的蒸馏方法、大幅减少采样步骤、以及广泛的任务和模型架构适应性。实验结果显示,该方法在文本到图像生成、图像修复、超分辨率和人脸交换等任务中均表现出色,生成图像质量高且与输入条件匹配度好。此外,该方法训练效率高,资源消耗低,为扩散模型的广泛应用提供了有力支持。
2025-05-15 15:16:06
1771
原创 Fine-Tuning Image Conditional Diffusion Models is Easier than you Think
利用扩散模型对生成图像的深度图和法线图,修改了marigold推理中噪声输入和时间步长不匹配的问题,极大的提高推理速度
2025-05-09 13:29:57
652
原创 SINE (SINgle Image Editing with Text-to-Image Diffusion Models) 单图像编辑与文生图扩散模型
SINE (SINgle Image Editing with Text-to-Image Diffusion Models)论文学习
2025-05-08 09:38:53
2018
原创 SinGAN: Learning a Generative Model from a Single Natural Image
我们引入了SinGAN,一个可以从单个自然图像中学习的无条件生成模型。我们的模型被训练来捕捉图像中补丁的内部分布,然后能够生成高质量的、不同的样本,这些样本携带与图像相同的视觉内容。SinGAN包含一个金字塔式的全卷积gan,每个gan负责学习图像不同尺度上的patch分布。这允许生成任意大小和宽高比的新样本,这些样本具有显著的可变性,但同时保持了训练图像的全局结构和精细纹理。与以前的单图像GAN方案相比,我们的方法不仅限于纹理图像,而且不是有条件的(即它从噪声中生成样本)。
2025-04-29 15:14:07
611
原创 SinDDM: A Single Image Denoising Diffusion Model
去噪扩散模型(DDMs)在图像生成、编辑和恢复方面带来了惊人的性能飞跃。然而,现有的ddm使用非常大的数据集进行训练。在这里,我们介绍了一个在单个图像上训练DDM的框架。该方法采用多尺度扩散过程学习训练图像的内部统计信息。为了驱动反向扩散过程,我们使用全卷积轻量级去噪器,该去噪器以噪声水平和尺度为条件。这种架构允许以一种从粗到精的方式生成任意维度的样本。正如我们所说明的,SinDDM生成各种高质量的样本,并适用于广泛的任务,包括样式转移和协调。此外,它可以很容易地引导外部监督。
2025-04-16 20:48:53
722
原创 U-net模型和生成对抗网络GAN模型了解
激活函数不是用来激活什么,而是把并映射到对应的分类标签上个人理解就是一个二极管,用来对数据进行分类把大于0的数据都保留,而小于0的数据直接清零。
2025-04-02 21:19:46
2069
原创 Pixel2Pixel_A_Pixelwise_Approach_for_Zero-Shot_Single_Image_Denoising
多个卷积层,特征图数量逐渐增加(64→128→256→512),卷积核大小为3x3,步长为2(用于下采样),后面跟着批量归一化和Leaky ReLU激活函数。大多数基于无监督深度学习的去噪方法,包括自监督和零采样方法,都依赖于一个共同的假设,即图像中的噪声是像素独立的。:使用9x9的卷积核,3个特征图(对于RGB图像),步长为1,输出高分辨率(SR)图像。:卷积层,使用9x9的卷积核,64个特征图,步长为1,后面跟着PReLU激活函数。零均值噪声图片是指图片中的噪声具有零均值的特性,即噪声的平均值为零。
2025-03-26 20:41:22
876
空空如也
各名次权值由用户指定是什么意思
2021-06-01
TA创建的收藏夹 TA关注的收藏夹
TA关注的人