【arxiv 2024】T2V-CompBench: A Comprehensive Benchmark for Compositional Text-to-video Generation
一、前言
Authors: Kaiyue Sun, Kaiyi Huang, Xian Liu, Yue Wu, Zihan Xu, Zhenguo Li, Xihui Liu
概述:
✔️ 对组合文本到视频生成进行首次系统研究,并提出基准 T2V-CompBench。
✔️ 通过精心设计的指标评估组合性的各个方面,涵盖 7 个类别和 700 个文本提示。
✔️ 提出专为组合 T2V 生成而设计的评估指标,并通过人工评估进行验证:基于 MLLM 的评估指标、基于检测的评估指标和基于跟踪的评估指标。
✔️ 对 20 个文本到视频生成模型进行基准测试和分析,强调当前模型组合文本到视频生成的重大挑战,旨在指导未来的研究。
【Paper】 > 【Github_Code】 > 【Project】
Abstract
mitivation:
文本到视频