一秒100张实时生成二次元老婆照!高吞吐低延迟低功耗|登顶GitHub热榜、已开源...

部署运行你感兴趣的模型镜像
西风 发自 凹非寺
量子位 | 公众号 QbitAI

单RTX4090,每秒生成100张图!

a81188779063afe83bc8d962cf56ad07.gif

一种专为实时交互式图像生成而设计的一站式解决方案,登顶GitHub热榜

31b4da8635e48279d515533ca4aadaf2.gif

方案名为StreamDiffusion,支持多种模型和输出帧率。

b37aea24fc6356e8a6753c180d2d426e.gif

无论是图像到图像,还是文本到图像,都能实时生成:

2843402848c581e10ad589fb627fbca3.gif

重点是,该项目现已开源,在GitHub热榜已狂揽3400+星。

4f0b22c573474618336a587319ca0862.png

经测试,使用SD-turbo模型在去噪步骤为1步的情况下,文本-图像每秒帧率可达106,图像-图像每秒帧率达到93。

CM-LoRA+KohakuV2模型在4步的情况下,文本-图像每秒帧率为38,图像-图像每秒帧率为37。

91501ec740e764edd1dd3f159060092b.png

除了高吞吐量、低延迟,StreamDiffusion还做到了低功耗。单块RTX3060上,可降低58.2%的功耗;单块RTX4090,降低49.8%。

网友们也是玩嗨了,纷纷上手尝试:

0f524feef3379b7f421d64988002d13b.gif

浅浅留下一个字:

b1dbfae36cd5a1ede2accd35c78793f1.png

StreamDiffusion长啥样?

StreamDiffusion由来自UC伯克利、日本筑波大学等的研究人员联合提出。

816a0866b9744d1f7ed2cf8c6cd9ebc7.png

StreamDiffusion Pipeline包含六大组件:Stream Batch、残差无分类器指导(RCFG)、输入-输出队列、随机相似性过滤器、KV-Caches预计算、带有小型自动编码器的模型加速工具。

首先Stream Batch,是将原来顺序的去噪步骤改为批量化处理。允许在一个批处理中,每幅图像处于去噪流程的不同阶段。

如此一来,可以大大减少UNet推理次数,显著提高吞吐量。

a1d1e48ce00126fbb2e2a5f517454dea.png

此外,原先的CFG算法中,需要额外大量计算负样本,导致计算效率低下。

RCFG方法则构建一个“虚拟残差噪声”,这样就只需要一次或者零次负样本计算,减少了计算负样本的开销。

e56172380aa3a8a3fa28d8eb4f5fb055.png

相比之前的CFG方法加速了2倍。

646515ce1357de1e389eee457ae34007.png

输入-输出队列主要是利用队列存储缓冲输入和输出,将图像数据预处理等操作与UNet主体网络分隔开,实现pipeline各个处理环节的并行化,防止处理速度不匹配的情况发生。

随机相似性过滤器,可以基于图像相似性跳过一些UNet处理,减少不必要的计算量,降低功耗:

f2ff7c1b1719645432bc26c49673bf48.gif

预计算则是提前缓存一些静态量,如提示嵌入、噪声样本等,减少每次生成的重复计算。

df2c056f94c00cb3c7b1089456a89174.png

最后,使用TensorRT、Tiny AutoEncoder等加速模块,对模型进行优化,进一步提升推理速度。

09dcdd76bd3f9ea19ebe27f6aab67440.png

在测试阶段,研究人员使用SD-turbo、512x512分辨率、批处理大小为1,进行文本到图像的生成。

结果,使用StreamDiffusion可以在10毫秒内生成一张图像,也就是一秒100多张图。

参考链接:https://github.com/cumulo-autumn/StreamDiffusion

—  —

点这里👇关注我,记得标星哦~

您可能感兴趣的与本文相关的镜像

TensorRT-v8.6

TensorRT-v8.6

TensorRT

TensorRT 是NVIDIA 推出的用于深度学习推理加速的高性能推理引擎。它可以将深度学习模型优化并部署到NVIDIA GPU 上,实现低延迟、高吞吐量的推理过程。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值