潜在一致性模型(LCMs)基于Stable Diffusion,但能够以更快的速度生成图像,通常只需4到8步即可获得优质图像(相比之下,原模型需要25到50步)。通过在M1或M2 Mac上运行LCM,可以以每秒一张的速度生成512x512的图像。
Simian Luo等人发布了首个经过提炼的Stable Diffusion模型。该模型是从Dreamshaper微调版本中提炼而来,通过将无分类器引导纳入模型输入实现。目前仅有一个模型被提炼出来,但未来会发布更多。论文作者们正在对Stable Diffusion 2.1和SDXL进行提炼工作。
你可以在Replicate云端运行首个潜在一致性模型,也可以在本地运行。除了生成预测图像,你还可以对其进行修改、调整并构建新的应用。
前提条件
需要准备:
- 配备M1或M2芯片的Mac
- 16GB或以上内存
- macOS 12.3或更高版本
- Python 3.10或更高版本
测试发现,配备32GB内存的M1 Max或M2芯片能在1秒内生成图像。配备16GB内存的M1 Pro则需要2到4秒。欢迎在GitHub仓库分享你的测试结果。
设置Python环境
需要Python 3.10或更高版本。运行 python -V 查看已安装的Python版本:
$ python3 -V
Python 3.10.6
如果版本是3.10或更高(如此处所示),则可以继续下一步。否则,需要安装Python 3.10。最简单的方法是使用Homebrew。首先,如果尚未安装Homebrew,请先安装。
然后,安装最新版本的Python:
brew update
brew install python
现在运行 python3 -V 应该显示3.10或更高版本。可能需要重新打开控制台才能生效。
克隆仓库并安装依赖
运行以下命令从GitHub克隆LCM脚本:
git clone https://github.com/replicate/latent-consistency-model.git
cd latent-consistency-model
然后,设置虚拟环境以安装依赖:
python3 -m pip install virtualenv
python3 -m virtualenv venv
激活虚拟环境:
source venv/bin/activate
(以后每次运行脚本时都需要重新运行此命令。)
接着,安装依赖:
pip install -r requirements.txt
运行模型!
现在,你可以运行潜在一致性模型了。脚本会自动从HuggingFace下载SimianLuo/LCM_Dreamshaper_v7(3.44 GB)和安全检查器(1.22 GB)模型。
python main.py \
"a beautiful apple floating in outer space, like a planet" \
--steps 4 --width 512 --height 512
你将看到类似以下的输出:
Output image saved to: output/out-20231026-144506.png
Using seed: 48404
100%|███████████████████████████| 4/4 [00:00<00:00, 5.54it/s]
还添加了一个 --continuous 标志,以便持续生成图像直到硬盘存满。首次生成后的后续生成速度也会更快。
python main.py \
"a beautiful apple floating in outer space, like a planet" \
--steps 4 --width 512 --height 512 --continuous
就是这样!
后续步骤
- 如果在设置过程中遇到困难,或无法达到预期速度,可以在Discord中寻求帮助,或查看GitHub仓库。
- 如果你想托管自己的创作,可以将自定义模型推送到Replicate。
- 可以在Replicate上尝试支持img2img的潜在一致性模型。
- 在X上关注 @replicate。
祝你玩得开心!
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
1125

被折叠的 条评论
为什么被折叠?



