ComfyUI-WanVideoWrapper 使用指南
【免费下载链接】ComfyUI-WanVideoWrapper 项目地址: https://gitcode.com/GitHub_Trending/co/ComfyUI-WanVideoWrapper
ComfyUI-WanVideoWrapper 是一个为 ComfyUI 提供的包装器节点,用于与 WanVideo 视频生成和编辑工具进行交互。该项目简化了在 ComfyUI 中使用 WanVideo 功能的过程,支持多种视频生成模型和扩展功能。
项目介绍
ComfyUI-WanVideoWrapper 主要特点:
- 提供自定义节点包装器,支持 WanVideo 及相关模型
- 支持多种扩展模型,包括 SkyReels、WanVideoFun、ReCamMaster 等
- 包含 VRAM 管理优化,支持块交换和异步卸载
- 提供丰富的示例工作流程和输入数据
环境准备与安装
前置要求
- Python 3.x
- pip 包管理工具
- ComfyUI 环境
安装步骤
- 克隆项目到本地:
git clone https://gitcode.com/GitHub_Trending/co/ComfyUI-WanVideoWrapper
cd ComfyUI-WanVideoWrapper
- 安装依赖包:
pip install -r requirements.txt
如果使用 ComfyUI 便携版安装,需要在 ComfyUI_windows_portable 文件夹中运行:
python_embeded\python.exe -m pip install -r ComfyUI\custom_nodes\ComfyUI-WanVideoWrapper\requirements.txt
依赖包说明
项目需要安装以下主要依赖:
- ftfy:文本修复工具
- accelerate>=1.2.1:加速计算库
- einops:张量操作库
- diffusers>=0.33.0:扩散模型库
- peft>=0.17.0:参数高效微调
- sentencepiece>=0.2.0:文本分词
- protobuf:协议缓冲区
- pyloudnorm:音频响度标准化
- gguf>=0.17.1:GGUF模型格式支持
- opencv-python:计算机视觉库
- scipy:科学计算库
模型配置
模型下载与放置
需要从指定来源下载以下模型文件并放置到对应目录:
- 文本编码器:放置到
ComfyUI/models/text_encoders - CLIP视觉模型:放置到
ComfyUI/models/clip_vision - Transformer主模型:放置到
ComfyUI/models/diffusion_models - VAE模型:放置到
ComfyUI/models/vae
支持的扩展模型
项目支持多种扩展模型,包括:
- SkyReels:高质量视频生成
- WanVideoFun:趣味视频特效
- ReCamMaster:摄像机控制
- VACE:视频音频编码
- ATI:高级时间插值
- Uni3C:统一3D控制
- FantasyTalking:奇幻对话生成
- MultiTalk:多说话人支持
- 以及其他多种专业视频处理模型
使用示例
项目提供了丰富的示例工作流程,位于 example_workflows 目录中,包含:
- 图像到视频转换示例
- 文本到视频生成示例
- 视频到视频转换示例
- 音频驱动视频生成
- 摄像机控制示例
- 特效处理示例
示例输入文件
项目包含多种示例输入文件:
- 图像文件:woman.jpg、env.png、human.png、thing.png
- 视频文件:jeep.mp4、MTV_crafter_example_pose.mp4、wolf_interpolated.mp4
- 音频文件:woman.wav
VRAM 管理优化
LoRA 权重处理改进
最新版本改进了 LoRA 权重的处理方式:
- 之前:LoRA 权重始终从 RAM 加载,效率较低
- 现在:LoRA 权重作为缓冲区分配给相应模块,支持块交换统一卸载
- 优点:支持异步卸载预取功能,提高效率
- 注意事项:如果不使用块交换,VRAM 使用量会增加
内存使用调整示例
如果使用 1GB LoRA 未合并权重并交换 20 个块:
- 单个块增加 25MB
- 20 个块总共增加 500MB VRAM 使用量
- 可通过交换额外 2 个块来补偿
最佳实践
性能优化建议
- 上下文窗口设置:使用 81 帧窗口大小和 16 帧重叠,在 1.3B T2V 模型上使用不到 5GB VRAM
- 模型选择:根据硬件配置选择合适的模型尺寸
- 块交换配置:合理配置块交换数量以优化内存使用
使用技巧
- 对于 I2V 模型,阈值值应设置为原来的 10 倍
- 使用系数时,0.25-0.30 范围效果较好,开始步骤可以是 0
- 如果阈值设置更激进,可能需要稍后开始以避免早期步骤跳过
故障排除
常见问题
-
torch.compile VRAM 问题:更新后可能出现 VRAM 使用异常
- 解决方法:清除 Triton 缓存文件
- 缓存位置:
C:\Users\<username>\.triton和C:\Users\<username>\AppData\Local\Temp\torchinductor_<username>
-
内存不足:调整块交换数量或使用更小的模型
项目结构
主要目录结构:
ATI/:高级时间插值模块FlashVSR/:视频超分辨率HuMo/:人体运动模型MTV/:多视角视频处理Ovi/:音频处理模块wanvideo/:主要 WanVideo 实现example_workflows/:示例工作流程- 以及其他功能模块
ComfyUI-WanVideoWrapper 为视频生成和编辑提供了强大的工具集,通过合理的配置和使用,可以充分发挥 WanVideo 及相关模型的能力,创造出高质量的视频内容。
【免费下载链接】ComfyUI-WanVideoWrapper 项目地址: https://gitcode.com/GitHub_Trending/co/ComfyUI-WanVideoWrapper
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考





