之前使用ComfyUI的Wan2.2工作流比较过24G显存的3090和4090两张显卡的算力表现:
比较4090和3090在ComfyUI的Wan2.2工作流的性能表现
这里选用同一个 Wan2.2 ComfyUI 工作流,在文生视频场景下直接对比 A100 40 GB 与 4090 48 GB 的实测性能表现。
测试环境直接在晨涧云算力平台一键拉起:两台 Wan-ComfyUI 云容器实例,分别挂载 4090 48 GB 与 A100 40 GB,镜像、驱动、依赖完全一致,保证变量一致。

工作流沿用官方预置的「Wan2.2 14B T2V」14B 文生视频模板。随后用同一支 Python 脚本连续调用 ComfyUI API 生成视频,跑多次取平均,同时记录显存占用、GPU 利用率与端到端耗时,横向量化两张卡的差距。
先补充之前跑的4090 24G显卡的测试结果,用于更直观地进行对比。
4090 24G测试结果

4090 48G测试结果

A100 40G测试结果

测试结果解释
先跟 24 GB 的 4090 对比,A100 40 GB 和 4090 48 GB 两张卡都能把 14B 模型一次装进显存,中途不再往系统内存倒数据,显存占用明显上升,整体耗时比 24 GB 更少。
实测 5 秒 480p 视频,各跑 5 次取平均:
- A100 40 GB:53 秒
- 4090 48 GB:50 秒
资源占用:
- A100 平均 32 GB,平均 91 % GPU 利用率
- 4090 平均 38 GB,平均 96 % GPU 利用率
显存足够的情况下,4090 48G核心跑得更满,利用率更高。
整体测试结果,Wan 2.2文生视频场景,4090 48G的算力表现要略好于A100 40G。
1994

被折叠的 条评论
为什么被折叠?



