stable diffusion 优化加速文生图效率

Qiming_v

已于 2024-07-27 13:44:29 修改

阅读量598

点赞数 4

分类专栏： Diffusers 文章标签：深度学习 pytorch

于 2024-07-23 21:29:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/zhilaizhiwang/article/details/140645848

版权

参考自：Accelerate inference of text-to-image diffusion models

默认使用diffusers

1.bfloat16

使用 torch.bfloat16 或者torch.float16，降低数据精度能加快推理速度，并且对结果的影响也很小。
如果GPU的内存不足，也可以使用torch.bfloat16 或者torch.float16，能降低内存占用。

pipe = StableDiffusionXLPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0", torch_dtype=torch.bfloat16
).to("cuda")

2.SDPA

scaled_dot_product_attention，在diffusers中已经默认使用。

scores = torch.matmul(Q, K.transpose(-1, -2)) / np.sqrt(d_k)
将scores除以d_k的平方根（np.sqrt(d_k)），这就是所谓的缩放，已经是transformers的默认操作了。

3.torch.compile

需要PyTorch 2 以上版本。第一次编译会很慢，编译好了推理会提速很多。

from diffusers import StableDiffusionXLPipeline
import torch

torch._inductor.config.conv_1x1_as_mm = True
torch._inductor.config.coordinate_descent_tuning = True
torch._inductor.config.epilogue_fusion = False
torch

最低0.47元/天解锁文章

博客等级

码龄16年

57
原创

728
点赞

486
收藏

503
粉丝

关注

私信

热门文章

分类专栏

Diffusers 13篇

展开全部收起

上一篇：: StyleGAN2中Generator，modulation，demodulate代码解读

下一篇：: stable diffusion文生图代码解读

最新评论

agent使用function 连续问答聊天
源的哥: 还要花钱
知识蒸馏教程 Knowledge Distillation Tutorial
Qiming_v: 学生模型毕竟比教师模型小很多，准确率低也很正常。而且学生模型学习的是教师模型的知识，准确率也很难超过教师模型。文中，学生模型在蒸馏前后准确率并没有太大变化，我觉得是教师模型和学生模型都训练次数太少的原因，教师模型学到的东西并没有多很多。
知识蒸馏教程 Knowledge Distillation Tutorial
秋风&怀念: 为什么没有老师的模型的准确率更高
知识蒸馏教程 Knowledge Distillation Tutorial
优快云-Ada助手: 恭喜你这篇博客进入【优快云每天值得看】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/619556723。
Stable Diffusion XL(SDXL)笔记
优快云-Ada助手: 恭喜你这篇博客进入【优快云每天值得看】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/619556300。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。