当前很多ComfyUI工作流的应用都是基于4090显卡来执行的,对于大部分的文生图场景,无论是4090和3090的性能都是足够的。
这里主要测试Wan2.2的文生视频场景下4090和3090两张显卡的性能表现。
Wan (通义万相) 2.2是当前比较火的文生视频大模型,ComfyUI最新版本已经预置了Wan2.2的多个模板,如文生视频、图生视频、视频人物替换等:

这里基于ComfyUI预置的Wan2.2模型工作流模板来测试在3090和4090两张显卡的性能表现。
从 晨涧云 算力租赁平台使用 Wan-ComfyUI 镜像分别创建 3090 和 4090 的显卡实例进行测试。
选择工作流
这里选择ComfyUI预置的「视频生成」模板中Wan2.2的第一个模板 Wan2.2 14B T2V 测试14B模型的文生视频应用。打开后工作流是长这样的:

点击 「运行」,会生成一个5秒的视频:
wan2.2 14B t2v
然后我们写一个Python脚本来调用ComfyUI的API,通过工作流自动生成视频,并通过多次调用取平均的方式来统计比较3090和4090执行性能的差异,以及对显卡资源的占用情况。
3090测试

4090测试

测试结果解释
这里每个测试都跑了5次,取平均视频生成的耗时时长;同时记录显卡的显存和GPU使用情况,3090和4090两张显卡的显存使用和GPU利用率都比较接近。
从测试结果看,3090生成5秒Wan示例视频的平均耗时在142.6秒,4090的平均耗时在59.4秒,3090生成视频的耗时是4090的2.4倍左右,所以,4090在文生视频场景下的性能表现明显优于3090,基本与显卡参数的算力数据差距一致。
1908

被折叠的 条评论
为什么被折叠?



