https://github.com/PKU-YuanGroup/Open-Sora-Plan/blob/main/docs/Data.md
GitHub - hpcaitech/Open-Sora: Unofficial implementation of OpenAI's Sora
目前两个开源的复现sora的git,其中colossal用的是STDiT架构,北大用的是VideoGPT(vqvae+gpt)。
Open-Sora已涵盖:
提供完整的Sora复现架构方案,包含从数据处理到训练推理全流程。
支持动态分辨率,训练时可直接训练任意分辨率的视频,无需进行缩放。
支持多种模型结构。由于
本文档介绍了Open-Sora项目,这是一个针对OpenAI Sora的开源复现,旨在提供Sora算法的完整复现流程,包括数据处理、性能优化和训练推理。项目特点包括动态分辨率支持、多模型结构和多种视频压缩方法。在数据准备部分,详细说明了使用MSR-VTT数据集和其他自定义数据集的方法。此外,文中还分享了训练过程中的经验与解决方案。
订阅专栏 解锁全文
877

被折叠的 条评论
为什么被折叠?



