Diffusion
文章平均质量分 74
prinTao
我是prinTao,计算机视觉与机器人方向。欢迎关注我,一起学习CV~
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【diffusers教程】五、噪声调度器的更换与自定义
扩散模型中的噪声调度器 噪声调度器是扩散模型的核心组件,它控制着噪声在扩散过程中的添加方式。摘要如下: 基本原理:扩散模型通过匹配生成分布和真实分布来优化,噪声调度器定义每一步的噪声程度(qπ),让模型(pπ)学习这个过程。 改进方法: iDDPM采用余弦加噪策略 VDM将加噪策略变为可训练参数 调度器类型: 常用调度器包括DDPM(线性)、DDIM(加速)、PNDM(伪数值)等 不同调度器在速度/质量上有权衡,步数范围从10-1000不等 实现方式: 可通过替换预定义配置来更改调度器 支持参数调整(如be原创 2025-06-26 16:02:22 · 1182 阅读 · 0 评论 -
【论文阅读】DynamicControl :一种新的controlnet多条件控制方法
现有方法要么处理条件效率低下,要么使用固定数量的条件,这并不能完全解决多个条件的复杂性及其潜在冲突。这强调了需要创新方法来有效管理多种条件,以实现更可靠和详细的图像合成。为了解决这个问题,我们提出了一个新的框架 DynamicControl ,它支持不同控制信号的动态组合,允许自适应选择不同数量和类型的条件。本文方法从一个双循环控制器开始,它通过利用预先训练的条件生成模型和判别模型为所有输入条件生成初始真实分数排序。此控制器评估提取条件和输入条件之间的相似性,以及与源图像的像素级相似性。原创 2024-12-25 15:26:08 · 1668 阅读 · 0 评论 -
【Diffusers】DDIM的深入探索:API、代码、以及reverse DDIM
DDIM 及其反转原创 2024-04-17 21:23:22 · 2295 阅读 · 0 评论 -
【DiT 】推理代码
根据尺寸自动下载模型。原创 2024-03-27 15:25:48 · 645 阅读 · 0 评论 -
常用 的 预训练权重格式 safetensor、ckpt、LoRA
检查点成功转换后,您将看到包含转换后的检查点的新存储库的链接。点击新存储库的链接,您将看到 Convert KerasCV Space 生成了一个带有推理小部件的模型卡,用于尝试转换后的模型。根据模型的训练方式,您不一定需要提供 UNet 和文本编码器的路径。在开始之前,请确保您有 Diffusers 的本地克隆来运行脚本并登录到您的 Hugging Face 帐户,以便您可以打开拉取请求并将转换后的模型推送到 Hub。转换这些格式以在 Diffusers 中使用,可以让您使用该库支持的所有功能,例如**原创 2024-03-07 10:16:02 · 2007 阅读 · 0 评论 -
【Diffusers】三、扩散模型的训练流程
通常,最好的结果是通过在特定数据集上微调预训练模型来获得的。,以生成自己的 🦋 蝴蝶 🦋。原创 2024-03-07 10:07:29 · 4302 阅读 · 0 评论 -
【Diffusers教程】二、Diffusers 的 pipeline,利用同一个模型完成不同模态任务
对于某些工作流程或者如果您要加载许多管道,从检查点重用相同的组件会更节省内存,而不是重新加载它们,这会不必要地消耗额外的内存。如果您想更改新管道的行为,您可以覆盖原始管道中的任何参数甚至配置。**方法检测原始管道类并将其映射到与您想要执行的任务相对应的新管道类。如果对库和扩散模型不熟悉,可能很难知道要使用哪个管道来完成任务。此方法从先前加载的管道的组件创建新管道,无需额外的内存成本。**您还可以传递特定于管道类的任何其他参数,例如。,并会在幕后加载相应的**如果您想进行修复,则**同样,对于图像到图像,原创 2024-03-07 09:32:39 · 1336 阅读 · 0 评论 -
【Diffusers教程】一、简介:快速使用Diffusion网络
原始教程地址: https://huggingface.co/docs/diffusers/using-diffusers/write_own_pipeline。原创 2024-03-06 20:53:02 · 6417 阅读 · 2 评论 -
【低显存】 diffusion 爆显存的解决方法
降低diffusion显存占用的四个方法原创 2024-03-06 20:49:40 · 3159 阅读 · 0 评论 -
【debug】OSError: Can‘t load tokenizer for ‘XXX‘. If you were trying to load it from ‘https://huggingf
本地目录与 ‘openai/clip-vit-large-patch14’ 同名:如果你的本地目录中有一个名为 ‘openai/clip-vit-large-patch14’ 的文件夹,可能会导致加载错误。请检查你的工作目录或者其他相关目录中是否有同名文件夹,并确保没有命名冲突。模型路径错误:确保 ‘openai/clip-vit-large-patch14’ 是正确的模型路径,可以尝试重新确认模型路径是否正确。原创 2024-03-06 14:56:14 · 12768 阅读 · 2 评论 -
ldm 的pip错误安装问题
基于diffsion的很多工作需要使用ldm库,但是部分仓库的教程没有写明是哪个ldm。原创 2024-03-06 11:05:36 · 1582 阅读 · 0 评论 -
DDPM中的 最优贝叶斯去噪(Optimal Bayesian Denoising)
最优贝叶斯去噪(Optimal Bayesian Denoising)是统计学中的一种方法,用于处理具有噪声的随机变量或数据。它的核心目标是从噪声数据中估计出最接近真实未受干扰数据的版本。这个方法基于贝叶斯统计理论,通过最小化均方误差(Minimum Mean Square Error,MMSE)来进行去噪。以下是有关最优贝叶斯去噪的一般介绍:贝叶斯统计理论:最优贝叶斯去噪是建立在贝叶斯统计理论的基础上的。它使用概率分布和贝叶斯定理来建模噪声和信号之间的关系。原创 2024-01-12 10:16:49 · 1665 阅读 · 0 评论
分享