有点意思！腾讯 ARC Lab 最新发布的MiraData数据集，用于长视频生成，从这些方面做了clip分层描述……

最新推荐文章于 2025-10-23 02:18:55 发布

原创

最新推荐文章于 2025-10-23 02:18:55 发布 · 1.8k 阅读

·

11

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

腾讯PCGARCLab开源的MiraData是一个专为长视频生成设计的数据集，提供长时间视频片段和详细结构化描述，通过GPT-4V生成高质量描述，助力视频生成研究。

最近小编网上冲浪时，被腾讯 PCG ARC Lab 新开源的文本-视频数据集——MiraData 吸引了目光。

这个数据集有多新？Readme在一天前刚更新完的那种，而且数据集有一大特点，是专门为长视频生成任务设计的大规模视频数据集，不仅提供了时长更长的数据，还从视频主体、背景、风格等不同维度进行了非常详细的文本“分层”描述，关注视频生成的小伙伴不容错过！相信一定能给你启发，赶紧和小编一睹为快。

MiraData项目地址：https://github.com/mira-space/MiraData

一、数据集概览

视频数据集在sora等视频生成大模型中发挥着至关重要的作用。然而，现有的文本-视频数据集在处理长视频序列和捕获镜头过渡方面往往存在不足。为了解决这些限制，腾讯 PCG ARC Lab 研究人员引入了MiraData（Mi ni-So ra Data），这是一个专门为长视频生成任务设计的大规模视频数据集。

（MiraData 官方Demo Video截图，来源：https://www.youtube.com/watch?v=3G0p7Jo3GYM）

MiraData 的主要特点

1. 长视频时长：与以前的数据集不同，以前的数据集视频剪辑通常非常短（通常小于 6 秒），MiraData 专注于时长从 1 到 2 分钟不等的未剪辑视频片段。这种延长的持续

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。