YouTubeVOS挑战:视频对象分割的前沿探索
1. 引言
视频分割是计算机视觉领域的重要研究方向,在视频编辑、自动驾驶和机器人技术等众多领域有着广泛应用。然而,此前在开发大规模视频分割基准测试以评估现有方法方面投入的精力较少。以往的方法只能在包含几十个视频的小数据集上进行评估,导致结果饱和且过度拟合。更重要的是,缺乏大规模视频分割数据集也限制了新颖大胆想法的发展。
自2017年起,开始收集首个用于视频对象分割(VOS)任务的大规模数据集——YouTubeVOS。与以往的视频对象分割数据集相比,YouTubeVOS是目前最大的视频对象分割数据集,为不同类型的视频对象分割问题提供了全面的基准测试。它具有以下优势:
- 数据集包含超过5000个高分辨率视频片段,从YouTube下载,内容丰富多样,规模是此前最大数据集(如DAVIS)的30倍以上。
- 数据集共有94个对象类别,涵盖动物、车辆、配饰和人类等常见对象。
- 数据集中的视频由业余和专业人士拍摄,除了各种对象运动外,还经常有显著的相机运动。
- 分割掩码由人工标注员精心标注,确保高质量。
- 数据集包含各种注释,可支持半监督视频对象分割、视频实例分割和指称视频对象分割等多个下游任务。
| 规模 | JC | ST | YTO | FBMS | DAVIS | YouTubeVOS |
|---|---|---|---|---|---|---|
| 视频数 |
超级会员免费看
订阅专栏 解锁全文
2258

被折叠的 条评论
为什么被折叠?



