详细安装和配置指南:Mochi 视频生成项目
mochi The best OSS video generation models 项目地址: https://gitcode.com/gh_mirrors/mochi9/mochi
1. 项目基础介绍
Mochi 是一个开源的视频生成项目,它提供了一个先进的视频生成模型,具有高保真运动和强大的提示符依从性。该项目旨在缩小封闭和开放视频生成系统之间的差距,并采用 Apache 2.0 许可证发布。Mochi 模型适用于创建高质量的生成视频,并且可以通过其 API 进行程序化调用。
主要编程语言:Python
2. 项目使用的关键技术和框架
- Asymmetric Diffusion Transformer (AsymmDiT):一种创新的扩散变压器架构,用于处理文本和视频令牌。
- T5-XXL 语言模型:用于编码用户提示的单个预训练语言模型。
- AsymmVAE:一种视频编码器-解码器结构,用于高效的视频压缩。
- PyTorch:Python 中的一个开源机器学习库,用于深度学习应用。
3. 项目安装和配置的准备工作
在开始安装之前,请确保您的系统中已经安装了以下依赖项:
- Python (推荐版本 3.8 及以上)
- pip (Python 包管理器)
- git (用于克隆仓库)
- FFMPEG (用于视频转换)
您还需要确保您的计算机具备足够的硬件资源,特别是显存(推荐至少 60GB VRAM)。
详细安装步骤
- 克隆项目仓库:
git clone https://github.com/genmoai/models.git
- 进入项目目录:
cd models
- 使用 pip 安装项目依赖:
pip install uv
- 创建虚拟环境并激活:
uv venv .venv
source .venv/bin/activate
- 安装项目设置:
uv pip install setuptools
uv pip install -e . --no-build-isolation
如果需要安装 flash attention,可以使用以下命令:
uv pip install -e .[flash] --no-build-isolation
- 下载模型权重,可以使用以下脚本:
python3 ./scripts/download_weights.py weights/
或者,您可以直接从 Hugging Face 下载权重文件到您的计算机。
- 运行 gradio UI 界面:
python3 ./demos/gradio_ui.py --model_dir weights/ --cpu_offload
或者,直接从命令行生成视频:
python3 ./demos/cli.py --model_dir weights/ --cpu_offload
如果您的项目中包含了 LoRA fine-tuning,可以添加 --lora_path <path/to/my_mochi_lora.safetensors>
参数到 gradio_ui.py
或 cli.py
。
以上步骤为基本的安装和配置指南,确保您按照项目要求正确安装所有依赖,并按照指示操作以成功运行 Mochi 视频生成模型。
mochi The best OSS video generation models 项目地址: https://gitcode.com/gh_mirrors/mochi9/mochi
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考