ComfyUI Wan2.2比较A100 40G和4090 48G算力性能

原创于 2025-12-03 13:44:11 发布 · 243 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#AI算力 #gpu算力 #AIGC #人工智能

AI算力专栏收录该内容

10 篇文章

订阅专栏

之前使用ComfyUI的Wan2.2工作流比较过24G显存的3090和4090两张显卡的算力表现：
比较4090和3090在ComfyUI的Wan2.2工作流的性能表现

这里选用同一个 Wan2.2 ComfyUI 工作流，在文生视频场景下直接对比 A100 40 GB 与 4090 48 GB 的实测性能表现。

测试环境直接在晨涧云算力平台一键拉起：两台 Wan-ComfyUI 云容器实例，分别挂载 4090 48 GB 与 A100 40 GB，镜像、驱动、依赖完全一致，保证变量一致。

ComfyUI-Wan-14B-T2V-工作流

工作流沿用官方预置的「Wan2.2 14B T2V」14B 文生视频模板。随后用同一支 Python 脚本连续调用 ComfyUI API 生成视频，跑多次取平均，同时记录显存占用、GPU 利用率与端到端耗时，横向量化两张卡的差距。

先补充之前跑的4090 24G显卡的测试结果，用于更直观地进行对比。

4090 24G测试结果

4090-ComfyUI-Wan测试结果

4090 48G测试结果

4090_48G-ComfyUI-Wan测试结果

A100 40G测试结果

A100-40G-ComfyUI-Wan测试结果

测试结果解释

先跟 24 GB 的 4090 对比，A100 40 GB 和 4090 48 GB 两张卡都能把 14B 模型一次装进显存，中途不再往系统内存倒数据，显存占用明显上升，整体耗时比 24 GB 更少。

实测 5 秒 480p 视频，各跑 5 次取平均：

A100 40 GB：53 秒
4090 48 GB：50 秒

资源占用：

A100 平均 32 GB，平均 91 % GPU 利用率
4090 平均 38 GB，平均 96 % GPU 利用率

显存足够的情况下，4090 48G核心跑得更满，利用率更高。

整体测试结果，Wan 2.2文生视频场景，4090 48G的算力表现要略好于A100 40G。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AI算力小知识

关注关注

7
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Wan2.2 文本到视频（Text-to-Video）——ComfyUI 部署与使用

weixin_42107409的博客

08-30

1994

本文提供了在GPU服务器上部署ComfyUI并运行Wan2.2视频生成模型的完整教程。内容包括硬件要求（推荐NVIDIA H100/A100）、系统环境准备（Ubuntu 20.04/22.04）、驱动安装、Python虚拟环境配置、模型文件下载（需Hugging Face账号）以及ComfyUI的启动方法。教程详细说明了SSH远程访问、目录结构优化建议，并提供了常见问题排查指南。此外还包含性能优化技巧、安全注意事项及部署建议，适合想要搭建文本到视频生成系统的开发者参考。

ComfyUI/Wan2.2 Smooth Mix 通用主题电影质感图生视频

10-31

AIGC工具平台Tauri+Django开源ComfyUI项目介绍和使用 https://datayang.blog.csdn.net/article/details/146316250 更多工具介绍项目源码搭建介绍：《我的AI工具箱Tauri+Django开源git项目介绍和使用》...

参与评论您还未登录，请先登录后发表或查看评论

5B参数打破视频生成铁律：Wan2.2-TI2V-5B如何让RTX 4090跑出电影级画面

gitblog_00784的博客

10-01

444

**导语**：阿里通义万相团队7月28日开源的Wan2.2-TI2V-5B模型，以50亿参数量实现720P@24fps高清视频生成，在消费级显卡上9分钟即可完成5秒成片，重新定义开源视频生成的效率标杆。 ## 行业现状：当视频生成遇上"参数诅咒" 2025年全球AI视频生成市场规模预计达25.63亿美元，但行业长期被"参数-性能-成本"三角困境困扰。据Fortune Business Insi...

阿里开源Wan2.2：电影级视频生成平民化，RTX 4090即可部署

gitblog_00340的博客

10-03

1265

**导语**：阿里巴巴7月28日开源的Wan2.2视频生成模型，以MoE架构和高压缩技术突破硬件限制，首次让消费级显卡实现720P电影级视频创作。 ### 行业现状：视频生成的"算力军备竞赛" 2025年AI视频生成市场迎来爆发期，Fortune Business Insights数据显示，该领域全球规模将从2024年6.15亿美元增长至2032年25.63亿美元，年复合增速达20%。但行业长期...

阿里开源电影级视频生成模型Wan2.2：本地部署3步上手，ComfyUI生态爆发

gitblog_00243的博客

10-08

1342

阿里开源Wan2.2：电影级视频生成模型，消费级显卡即可部署

gitblog_00671的博客

10-30

1205

**导语**：2025年7月28日，阿里巴巴正式开源新一代视频生成大模型Wan2.2，通过创新的MoE架构和电影级美学控制系统，首次将专业影视制作能力下放至消费级硬件，标志着AI视频生成进入"全民导演"时代。 ## 行业现状：视频生成的三重突破与挑战当前AI视频生成领域正经历从"能用"到"好用"的关键转型。根据某行业研究机构《2025 AI视频生成技术分析报告》，2024年全球视频生成模型市...

阿里开源Wan2.2：视频生成迈入电影级时代，RTX 4090即可本地部署

gitblog_00969的博客

10-04

562

**导语**：7月28日，阿里巴巴正式开源视频生成大模型Wan2.2，凭借混合专家架构（MoE）和高效压缩技术，首次实现消费级显卡运行720P电影级视频生成，重新定义开源视频模型性能标准。 ## 行业现状：从实验室到桌面的最后一公里 2025年，AI视频生成技术迎来爆发期，但行业长期面临"**性能与成本两难**"：闭源模型如Sora虽能生成电影级画面，却受限于API调用成本与创作自由度；开源模...

阿里云Wan2.2视频生成模型深度解析：ComfyUI落地实践与行业影响

gitblog_01118的博客

10-10

403

阿里云通义万相团队推出的Wan2.2视频生成模型，通过创新的MoE架构和多模态交互能力，将AI视频创作推向分钟级长视频生成新阶段，在ComfyUI生态中已形成完整工作流支持。 ## 行业现状：AI视频生成的技术突破点 2025年视频生成领域呈现"效率与质量双突破"的竞争格局。OpenAI Sora 2主打电影级视觉效果但依赖云端算力，快手可灵侧重移动端轻量化，而阿里云Wan2.2则通过**混合专...

2025视频生成革命：Wan2.2开源模型如何让RTX 4090实现电影级创作

gitblog_01189的博客

11-15

748

阿里云通义万相团队开源的Wan2.2视频生成模型，首次将混合专家（MoE）架构引入扩散模型，在消费级GPU上实现720P@24fps电影级视频生成，重新定义开源视频技术标准。 ## 行业现状：AI视频生成的"三高困境" 2024年全球AI视频生成市场规模达6.15亿美元，预计2032年将增长至25.63亿美元，年复合增长率20%。但行业普遍面临**高成本、高门槛、低可控性**三大痛点：商业模型

Wan2.2-S2V-14B的推理优化综述：从硬件到软件的全栈加速策略

gitblog_00656的博客

09-16

821

在AI视频生成领域，Wan2.2-S2V-14B作为新一代音频驱动电影级视频生成模型，面临着高分辨率（720P）、长时序（音频同步）和复杂运动控制的三重计算挑战。本综述系统梳理从硬件适配到算法优化的全栈加速策略，通过MoE架构特性解析、分布式推理框架部署、量化技术应用和计算图优化四个维度，构建消费级硬件可运行的高效推理方案。实测表明，优化后在单卡RTX 4090上可实现720P视频生成速度提升3....

ComfyUI/Wan 2.2 5B 混合模型文本图像转视频

08-26

ComfyUI/Wan2.2 SceneMotion 图生视频与运镜控制

10-31

蓝耘元生代GPU算力调度云平台深度解析：高性价比算力云与GPU算力租赁首选方案

qq_39811991的博客

12-02

353

在AI大模型训练、大数据处理、工业仿真等场景的算力需求爆发式增长背景下，算力云已成为连接算力供给与需求的核心桥梁，而GPU算力租赁则凭借灵活、低成本的优势，成为科研机构、企业及开发者的主流选择。平台核心亮点在于“高性能+高性价比+全功能闭环”，不仅搭载RTX 3090、RTX 4090等主流高性能GPU，支持最高12.2版本CUDA，配备Intel Xeon系列高性能CPU与充足内存/存储资源，更通过灵活的计费模式、完善的功能工具链与稳定的运行保障，成为GPU算力租赁领域的高性价比之选。

GPU算力租赁与算力云平台选型指南：从需求匹配到成本优化的实战思路

最新发布

qq_39811991的博客

12-02

647

以蓝耘元生代GPU算力调度云平台为例，其提供的RTX 3090/4090实例（搭配10-12核CPU、30-64GB内存）、按量/包年包月互转、无卡模式（0.1元/小时）、20GB免费存储等特性，正是基于上述选型维度的实践落地，可适配科研、企业、个人开发者的主流需求。：某计算机视觉团队需训练YOLOv8模型（数据集50GB），选择配备RTX 3090（24GB）、10核CPU、30GB内存的实例，GPU利用率稳定在85%以上，较搭配8核CPU的实例训练效率提升30%。

如何选择合适的GPU算力服务商？企业AI算力采购指南

qq_39811991的博客

12-01

712

蓝耘科技作为中国领先的GPU算力解决方案与算力云服务提供商，凭借20年行业深耕、超万P算力资源规模、自研智算云平台和全国数据中心布局，为AI应用与教科研创新持续赋能。完善的GPU云服务器平台不仅提供算力，还应配套丰富的开发资源。蓝耘GPU算力服务覆盖高校、科研院所、AI企业、汽车、互联网、政府、能源、医疗等25+个行业，积累了丰富的行业定制化经验。蓝耘在北京酒仙桥建设的自有智算中心采用液冷技术，部署单机柜48kW液冷机柜，有效降低GPU运行温度，避免因过热导致的降频问题，从而保障算力的持续稳定输出。

科幻小说计划 (顾雪) (AIGC)

穷人小水滴的博客

11-29

961

该续作计划世界观完整、设定硬核、人物立体，既紧密承接前作的人物与科幻核心，又通过“核战后”“星际移民”的设定实现格局升级，将“技术、爱情、权力、文明”四大元素深度绑定，兼具科幻感与人文深度。核心优势在于“科幻设定服务剧情”“人物特质贴合时代背景”，潜在突破点在于挖掘独裁统治、记忆丢失、星际旅行中的冲突，让“人类从末日走向星际”的主线更具张力。需要我帮你基于这份分析，提炼10个核心剧情冲突点（适配长篇100+章的叙事节奏），直接用于后续章节创作吗？答: 不是用完就丢！

硬核劝学：2026年 AI 工程师“飞升”指南 (LLM/RL/VLM/AIGC 全路线)

qq_73553710的博客

11-29

839

如果这篇博客让你感到焦虑，那就对了。焦虑是学习的动力。去下载一个或Qwen2.5-7B。安装vLLM，尝试在本地部署它。阅读DPO的论文，并尝试用库跑通一个最小的对齐 Demo。只有动手写代码 (Write Code)，你才能真正拥有它。(附注：文中提到的所有论文建议直接在 arXiv 搜索标题，工具库直接上 GitHub 搜索 Star 数最高的即可。2025年的技术，唯快不破。

Diff-MTS: Temporal-Augmented ConditionalDiffusion-Based AIGC

weixin_48372662的博客

12-01

1056

本文提出Diff-MTS模型解决工业多变量时间序列(MTS)数据生成难题。针对现有VAEs和GANs方法在真实性、训练稳定性及条件一致性方面的不足，创新性地结合扩散模型与条件自适应机制。核心贡献包括：(1)采用余弦噪声调度改进DDPM，保留更多时序信息；(2)设计Ada-MMD机制实现无分类器的条件对齐；(3)开发TDR-UNet网络，通过时序分解和注意力机制捕捉复杂依赖关系。实验表明，该模型能稳定生成高质量工业MTS数据，显著优于现有方法，为工业智能发展提供了有效数据支撑。

AIGC、Agent、MCP、A2A和AG-UI促进AI从基础能力到协同生态演进

智海观潮的博客

12-01

409

近年来，人工智能技术迎来爆发式发展，AIGC、Agent、MCP等概念相继涌现并快速迭代，推动AI从单一工具向协同生态演进，AI技术从“能对话”进化到“能干活”。2022年ChatGPT点燃了AIGC；Function Calling催生了Agent；再往后，行业发现「如何让模型低成本地调用外部世界」成为新瓶颈，于是MCP、A2A和AG-UI三大协议陆续登场。

comfyui WAN2.2

08-17

ComfyUI 是一个基于节点的工作流式用户界面，广泛用于图像生成、模型训练以及插件扩展等任务。WAN 2.2 是某些用户在 ComfyUI 中使用的模型或插件版本，通常用于图像风格迁移、图像修复或增强任务[^1]。 ### 下载指南 WAN 2.2 模型或插件的下载通常涉及以下几个步骤： 1. **GitHub 仓库**：许多 ComfyUI 插件和模型托管在 GitHub 上。可以搜索 `ComfyUI-WAN` 或 `WAN 2.2 ComfyUI` 相关的项目。例如： - [ComfyUI-Manager](https://github.com/ltdrdata/ComfyUI-Manager) 是一个插件管理器，支持一键安装和更新插件。 - 某些模型可能托管在 Hugging Face 上，可以通过模型页面直接下载。 2. **模型存放路径**： - ComfyUI 的模型通常存放在 `custom_nodes` 文件夹中。 - WAN 2.2 模型文件（如 `.pt` 或 `.pth`）应放置在 `models` 子目录下。 3. **插件安装**： - 如果 WAN 2.2 是一个插件，则需要将插件文件夹复制到 `custom_nodes` 目录下。 - 重启 ComfyUI 后，该插件将在节点列表中出现。 ### 使用指南安装完成后，WAN 2.2 的使用通常涉及以下流程： 1. **加载模型**： - 在 ComfyUI 节点编辑器中添加 `Load WAN 2.2 Model` 节点。 - 选择模型路径，加载预训练的 WAN 2.2 模型。 2. **输入图像处理**： - 使用 `Image Scale` 或 `Image Crop` 节点调整输入图像尺寸。 - 将图像连接到 WAN 2.2 模型节点的输入端口。 3. **执行图像增强**： - 添加 `Apply WAN 2.2` 节点，连接模型和图像输入。 - 配置参数如增强强度、风格迁移模式等。 - 执行流程后，输出图像将通过 `Image Output` 节点显示。 4. **保存结果**： - 使用 `Save Image` 节点将处理后的图像保存到指定路径。 ### 示例配置以下是一个简单的 WAN 2.2 使用流程示例（JSON 格式）： ```json { "nodes": [ { "id": "load_model", "type": "Load WAN 2.2 Model", "inputs": { "model_path": "models/wan_2_2.pt" } }, { "id": "load_image", "type": "Load Image", "inputs": { "image_path": "input_images/test.jpg" } }, { "id": "apply_wan", "type": "Apply WAN 2.2", "inputs": { "model": "#load_model.model", "image": "#load_image.image", "enhance_strength": 0.8 } }, { "id": "save_image", "type": "Save Image", "inputs": { "image": "#apply_wan.output_image", "output_path": "output_images/enhanced_test.jpg" } } ] } ``` ### 注意事项 - 确保模型文件与插件版本兼容。 - 如果使用 GPU，确保 CUDA 驱动和 PyTorch 版本匹配。 - 可通过 `ComfyUI-Manager` 自动更新 WAN 2.2 插件至最新版本。 ---