ComfyUI-WanVideoWrapper 使用指南

ComfyUI-WanVideoWrapper 使用指南

【免费下载链接】ComfyUI-WanVideoWrapper 【免费下载链接】ComfyUI-WanVideoWrapper 项目地址: https://gitcode.com/GitHub_Trending/co/ComfyUI-WanVideoWrapper

ComfyUI-WanVideoWrapper 是一个为 ComfyUI 提供的包装器节点,用于与 WanVideo 视频生成和编辑工具进行交互。该项目简化了在 ComfyUI 中使用 WanVideo 功能的过程,支持多种视频生成模型和扩展功能。

项目介绍

ComfyUI-WanVideoWrapper 主要特点:

  • 提供自定义节点包装器,支持 WanVideo 及相关模型
  • 支持多种扩展模型,包括 SkyReels、WanVideoFun、ReCamMaster 等
  • 包含 VRAM 管理优化,支持块交换和异步卸载
  • 提供丰富的示例工作流程和输入数据

环境准备与安装

前置要求

  • Python 3.x
  • pip 包管理工具
  • ComfyUI 环境

安装步骤

  1. 克隆项目到本地:
git clone https://gitcode.com/GitHub_Trending/co/ComfyUI-WanVideoWrapper
cd ComfyUI-WanVideoWrapper
  1. 安装依赖包:
pip install -r requirements.txt

如果使用 ComfyUI 便携版安装,需要在 ComfyUI_windows_portable 文件夹中运行:

python_embeded\python.exe -m pip install -r ComfyUI\custom_nodes\ComfyUI-WanVideoWrapper\requirements.txt

依赖包说明

项目需要安装以下主要依赖:

  • ftfy:文本修复工具
  • accelerate>=1.2.1:加速计算库
  • einops:张量操作库
  • diffusers>=0.33.0:扩散模型库
  • peft>=0.17.0:参数高效微调
  • sentencepiece>=0.2.0:文本分词
  • protobuf:协议缓冲区
  • pyloudnorm:音频响度标准化
  • gguf>=0.17.1:GGUF模型格式支持
  • opencv-python:计算机视觉库
  • scipy:科学计算库

模型配置

模型下载与放置

需要从指定来源下载以下模型文件并放置到对应目录:

  • 文本编码器:放置到 ComfyUI/models/text_encoders
  • CLIP视觉模型:放置到 ComfyUI/models/clip_vision
  • Transformer主模型:放置到 ComfyUI/models/diffusion_models
  • VAE模型:放置到 ComfyUI/models/vae

支持的扩展模型

项目支持多种扩展模型,包括:

  • SkyReels:高质量视频生成
  • WanVideoFun:趣味视频特效
  • ReCamMaster:摄像机控制
  • VACE:视频音频编码
  • ATI:高级时间插值
  • Uni3C:统一3D控制
  • FantasyTalking:奇幻对话生成
  • MultiTalk:多说话人支持
  • 以及其他多种专业视频处理模型

使用示例

项目提供了丰富的示例工作流程,位于 example_workflows 目录中,包含:

  • 图像到视频转换示例
  • 文本到视频生成示例
  • 视频到视频转换示例
  • 音频驱动视频生成
  • 摄像机控制示例
  • 特效处理示例

示例输入文件

项目包含多种示例输入文件:

  • 图像文件:woman.jpg、env.png、human.png、thing.png
  • 视频文件:jeep.mp4、MTV_crafter_example_pose.mp4、wolf_interpolated.mp4
  • 音频文件:woman.wav

示例工作流程

VRAM 管理优化

LoRA 权重处理改进

最新版本改进了 LoRA 权重的处理方式:

  • 之前:LoRA 权重始终从 RAM 加载,效率较低
  • 现在:LoRA 权重作为缓冲区分配给相应模块,支持块交换统一卸载
  • 优点:支持异步卸载预取功能,提高效率
  • 注意事项:如果不使用块交换,VRAM 使用量会增加

内存使用调整示例

如果使用 1GB LoRA 未合并权重并交换 20 个块:

  • 单个块增加 25MB
  • 20 个块总共增加 500MB VRAM 使用量
  • 可通过交换额外 2 个块来补偿

最佳实践

性能优化建议

  1. 上下文窗口设置:使用 81 帧窗口大小和 16 帧重叠,在 1.3B T2V 模型上使用不到 5GB VRAM
  2. 模型选择:根据硬件配置选择合适的模型尺寸
  3. 块交换配置:合理配置块交换数量以优化内存使用

使用技巧

  • 对于 I2V 模型,阈值值应设置为原来的 10 倍
  • 使用系数时,0.25-0.30 范围效果较好,开始步骤可以是 0
  • 如果阈值设置更激进,可能需要稍后开始以避免早期步骤跳过

故障排除

常见问题

  1. torch.compile VRAM 问题:更新后可能出现 VRAM 使用异常

    • 解决方法:清除 Triton 缓存文件
    • 缓存位置:C:\Users\<username>\.tritonC:\Users\<username>\AppData\Local\Temp\torchinductor_<username>
  2. 内存不足:调整块交换数量或使用更小的模型

项目结构

主要目录结构:

  • ATI/:高级时间插值模块
  • FlashVSR/:视频超分辨率
  • HuMo/:人体运动模型
  • MTV/:多视角视频处理
  • Ovi/:音频处理模块
  • wanvideo/:主要 WanVideo 实现
  • example_workflows/:示例工作流程
  • 以及其他功能模块

项目模块结构

ComfyUI-WanVideoWrapper 为视频生成和编辑提供了强大的工具集,通过合理的配置和使用,可以充分发挥 WanVideo 及相关模型的能力,创造出高质量的视频内容。

【免费下载链接】ComfyUI-WanVideoWrapper 【免费下载链接】ComfyUI-WanVideoWrapper 项目地址: https://gitcode.com/GitHub_Trending/co/ComfyUI-WanVideoWrapper

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值