Pyramid-Flow是一个由北京大学、快手科技和北京邮电大学的研究人员联合开发的视频生成模型。
Pyramid-Flow的核心是其创新的金字塔流匹配算法,该算法能够将视频生成过程分解成多个不同分辨率的阶段,每个阶段都负责从低分辨率向高分辨率逐渐细化图像。
Pyramid-Flow的另一个关键特性是它的自回归框架,框架下视频中的每一帧都是基于前一帧或历史帧的信息预测而来的,从而保证了动作的一致性和流畅性。
Pyramid-Flow模型支持端到端优化,采用单一的统一扩散变换器(DiT)进行训练,这样简化了实现,并允许整个系统在一个统一的框架内被优化。
Pyramid-Flow不仅可以用于娱乐和社交媒体,让用户生成有趣的内容分享给朋友,同样适用于电影电视制作、游戏开发以及广告营销等领域。
github项目地址:https://github.com/jy0205/Pyramid-Flow。
一、环境安装
1、python环境
建议安装python版本在3.10以上。
2、pip库安装
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
3、模型下载:
git lfs install
git clone https://huggingface.co/rain1011/pyramid-flow-sd3
二、功能测试
1、运行测试:
(1)python代码调用测试