视频生成模型评测基准 VBench,以其全面且细致的评测体系及评估效率,被国内外众多大模型厂商、研究机构及科技媒体所采用。VBench 榜单上的评分,已成为衡量视频生成模型性能的重要指标,并为模型能力提升提供了方向参考。
近日,VBench 评测基准已在司南评测社区集上线,诚邀开发者下载使用。本篇文章将详细解读 VBench 系列工作。
在人工智能蓬勃发展的当下,视频生成模型广泛应用于内容创作、娱乐、安防等领域,从影视特效制作到短视频生产,再到智能监控,其技术突破不断重塑人们的生活与工作模式。但随着各类视频生成模型不断涌现,如何精准评估其性能,成为研究者和从业者面临的关键问题。
-
到底哪个视频生成模型性能最强?
-
每个模型各自有什么特长?
-
AI 视频生成领域目前还有哪些值得关注的问题待解决?
在此背景下,上海人工智能实验室、南洋理工大学S-Lab、香港中文大学、南京大学联合发布了视频生成模型评测体系 VBench,其相关研究论文成功入选 CVPR 2024 Highlight 论文名单。
VBench 不仅包含了 16 个分层和解耦的评测维度,确保了评估的全面性和细致度,还通过贴近人类感知的评测方法,提高了评估结果的真实性和可靠性。其开源的代码及提示词体系,更是促进了技术的透明度和社区的参与,加速了视频生成技术的创新与迭代。
最新发布的 VBench++ 支持更广泛的视频生成任务,包括文本生成视频和图像生成视频,并配有一套自适应的图像套件,以便在不同的设置下进行公平评估。不

最低0.47元/天 解锁文章
1805

被折叠的 条评论
为什么被折叠?



