多模态图像,超长视频生成SOTA,Sora没做到的,LongVie框架给解决了

LongVie框架解决超长视频生成难题

从 Sora 的惊艳亮相到多款高性能开源模型的诞生,视频生成在过去两年迎来爆发式进步,已能生成几十秒的高质量短片。然而,要想生成时长超过 1 分钟、内容与运动可控、风格统一的超长视频,仍面临巨大挑战。

为此,上海人工智能实验室联合南京大学、复旦大学、南洋理工大学 S-Lab、英伟达等机构提出 LongVie 框架,系统性解决可控长视频生成中的核心难题。

图片

  • 项目主页:https://vchitect.github.io/LongVie-project/ 

  • 视频:https://www.youtube.com/watch?v=SOiTfdGmGEY&t=1s

  • 论文:https://arxiv.org/abs/2508.03694

  • Github:https://github.com/Vchitect/LongVie

难点剖析

直接利用当前的可控视频生成模型生成分钟级长视频时,通常会出现以下问题:

  • 时序不一致:前后画面细节与内容不连贯,出现闪烁等现象。

  • 视觉退化:随时长增长,出现颜色漂移、清晰度下降等问题。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值