吉时已到-优快云博客

原创 Flash Diffusion Accelerating Any Conditional Diffusion Model for Few Steps Image Generation

《闪光扩散：加速任何条件扩散模型的几步图像生成》提出了一种高效的蒸馏方法，显著加速了预训练扩散模型的图像生成过程。该方法在COCO2014和COCO2017数据集上实现了最先进的性能，仅需少量GPU小时训练和更少的可训练参数。其创新点包括与LoRA兼容的蒸馏方法、大幅减少采样步骤、以及广泛的任务和模型架构适应性。实验结果显示，该方法在文本到图像生成、图像修复、超分辨率和人脸交换等任务中均表现出色，生成图像质量高且与输入条件匹配度好。此外，该方法训练效率高，资源消耗低，为扩散模型的广泛应用提供了有力支持。

2025-05-15 15:16:06 1804

原创 Fine-Tuning Image Conditional Diffusion Models is Easier than you Think

利用扩散模型对生成图像的深度图和法线图，修改了marigold推理中噪声输入和时间步长不匹配的问题，极大的提高推理速度

2025-05-09 13:29:57 702

原创 SINE (SINgle Image Editing with Text-to-Image Diffusion Models) 单图像编辑与文生图扩散模型

SINE (SINgle Image Editing with Text-to-Image Diffusion Models)论文学习

2025-05-08 09:38:53 2067

原创 SinGAN: Learning a Generative Model from a Single Natural Image

我们引入了SinGAN，一个可以从单个自然图像中学习的无条件生成模型。我们的模型被训练来捕捉图像中补丁的内部分布，然后能够生成高质量的、不同的样本，这些样本携带与图像相同的视觉内容。SinGAN包含一个金字塔式的全卷积gan，每个gan负责学习图像不同尺度上的patch分布。这允许生成任意大小和宽高比的新样本，这些样本具有显著的可变性，但同时保持了训练图像的全局结构和精细纹理。与以前的单图像GAN方案相比，我们的方法不仅限于纹理图像，而且不是有条件的（即它从噪声中生成样本）。

2025-04-29 15:14:07 660

原创 SinDDM: A Single Image Denoising Diffusion Model

去噪扩散模型（DDMs）在图像生成、编辑和恢复方面带来了惊人的性能飞跃。然而，现有的ddm使用非常大的数据集进行训练。在这里，我们介绍了一个在单个图像上训练DDM的框架。该方法采用多尺度扩散过程学习训练图像的内部统计信息。为了驱动反向扩散过程，我们使用全卷积轻量级去噪器，该去噪器以噪声水平和尺度为条件。这种架构允许以一种从粗到精的方式生成任意维度的样本。正如我们所说明的，SinDDM生成各种高质量的样本，并适用于广泛的任务，包括样式转移和协调。此外，它可以很容易地引导外部监督。

2025-04-16 20:48:53 773

原创 U-net模型和生成对抗网络GAN模型了解

激活函数不是用来激活什么，而是把并映射到对应的分类标签上个人理解就是一个二极管，用来对数据进行分类把大于0的数据都保留，而小于0的数据直接清零。

2025-04-02 21:19:46 2248

原创 Pixel2Pixel_A_Pixelwise_Approach_for_Zero-Shot_Single_Image_Denoising

多个卷积层，特征图数量逐渐增加（64→128→256→512），卷积核大小为3x3，步长为2（用于下采样），后面跟着批量归一化和Leaky ReLU激活函数。大多数基于无监督深度学习的去噪方法，包括自监督和零采样方法，都依赖于一个共同的假设，即图像中的噪声是像素独立的。：使用9x9的卷积核，3个特征图（对于RGB图像），步长为1，输出高分辨率（SR）图像。：卷积层，使用9x9的卷积核，64个特征图，步长为1，后面跟着PReLU激活函数。零均值噪声图片是指图片中的噪声具有零均值的特性，即噪声的平均值为零。

2025-03-26 20:41:22 1045

原创 java知识学习

寻找解决问题的工具，并使用它解决问题，面向是工具，对象是问题钉钉子（问题）找锤子（工具）==》解决。

2024-09-28 17:48:34 780 1

qq_52936527的博客