学习笔记(二)----diffusion model

文章介绍了扩散模型,特别是DDPM,一种用于图像生成的去噪概率模型。通过前向过程加噪声和反向过程去噪,模型能将文本描述转化为图像。U-Net和马尔可夫链的概念也被提及,展示了训练过程和网络结构。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

代码:GitHub - CompVis/stable-diffusion: A latent text-to-image diffusion model

论文:[1505.04597] U-Net: Convolutional Networks for Biomedical Image Segmentation (arxiv.org)

一、什么是Diffusion Model(扩散模型)

(本文介绍的diffusion Model 是论文:Denoising Diffusion Probabilistic Models(DDPM)去噪扩散概率模型,DDPM是2020年提出,是AIGC主流生成模型)

我们可以看到最近很火的text-to-image,通过给定文本描述生成图片,当前最先进的两个text-to-image是OpenAI的DALL E2和Google的Imagen,他们都是基于扩散模型来完成的。

Diffusion Model也是生成模型的一种,因此在讲扩散模型之前,我们来简单回顾一下生成模型的发展:(图片来自:什么是扩散模型? |Lil'Log的 (lilianweng.github.io)

其他生成模型再次不展开讲述,扩散模型不同于以上生成模型,扩散模型的原理类似通过学习给图片去噪的过程,因此生成的图片比其他生成模型情绪度高。

扩散模型定义了一个马

### 安装和运行 Stable Diffusion 模型 #### 准备工作 为了在个人笔记本电脑上成功安装和运行 Stable Diffusion 模型,硬件需求是一个重要考量因素。建议使用的显卡型号包括但不限于 RTX 2060 (12GB)、RTX 2070 及其以上版本[^5]。 #### 软件环境搭建 对于软件环境的构建,在 Windows PC 上可以通过 Web-UI 实现本地运行 Stable Diffusion 的目标,并且这一过程不会产生额外费用[^1]。具体操作如下: 1. **获取模型文件** - 下载所需的模型文件是必不可少的一环。可以从 Hugging Face 或其他可信平台获得这些必要的模型文件,这里以 v1.5 版本作为例子说明[^2]。 2. **创建 Python 环境** 使用 Anaconda 创建一个新的虚拟环境来管理依赖项可以简化后续步骤。命令如下所示: ```bash conda create --name stable_diff python=3.9 conda activate stable_diff ``` 3. **安装依赖库** 根据官方文档或其他教程指导完成所需Python包的安装,通常涉及 PyTorch 和 torchvision 等机器学习框架以及一些辅助工具。 4. **配置Web界面** 如果选择了基于浏览器访问的方式,则需按照项目仓库中的指引设置对应的前端页面和服务端API接口之间的通信机制;这可能涉及到 Flask/Django RESTful API 开发经验。 5. **加载预训练权重** 将之前下载好的 `.ckpt` 文件放置到指定路径下以便程序能够读取并初始化网络结构参数。 ```python from diffusers import StableDiffusionPipeline, EulerDiscreteScheduler model_id = "path_to_your_model" scheduler = EulerDiscreteSampler() pipe = StableDiffusionPipeline.from_pretrained(model_id, scheduler=scheduler).to("cuda") ``` 上述代码片段展示了如何利用 `diffusers` 库快速加载自定义保存下来的 checkpoint 并将其迁移到 GPU 设备上加速计算效率[^3]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值