【arxiv 2024】T2V-CompBench: A Comprehensive Benchmark for Compositional Text-to-video Generation

旋转的油纸伞

已于 2024-07-29 18:37:03 修改

阅读量1.3k

点赞数 15

分类专栏：视频生成/视频理解文章标签： T2V Sora 人工智能 python 职场和发展

于 2024-07-26 14:35:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_45934285/article/details/140692662

版权

视频生成/视频理解专栏收录该内容

9 篇文章 ¥9.90 ¥99.00

订阅专栏

【arxiv 2024】T2V-CompBench: A Comprehensive Benchmark for Compositional Text-to-video Generation

一、前言
Abstract
1 Introduction
2 Related work
3 Benchmark Construction
4 Evaluation Metrics
5 Experiments
6 Conclusion and Discussions

一、前言

Authors: Kaiyue Sun, Kaiyi Huang, Xian Liu, Yue Wu, Zihan Xu, Zhenguo Li, Xihui Liu

概述：
✔️ 对组合文本到视频生成进行首次系统研究，并提出基准 T2V-CompBench。
✔️ 通过精心设计的指标评估组合性的各个方面，涵盖 7 个类别和 700 个文本提示。
✔️ 提出专为组合 T2V 生成而设计的评估指标，并通过人工评估进行验证：基于 MLLM 的评估指标、基于检测的评估指标和基于跟踪的评估指标。
✔️ 对 20 个文本到视频生成模型进行基准测试和分析，强调当前模型组合文本到视频生成的重大挑战，旨在指导未来的研究。
【Paper】 > 【Github_Code】 > 【Project】

Abstract

mitivation: 文本到视频

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

旋转的油纸伞 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。