视频目标分割技术:无监督与交互式方法解析
1 无监督视频目标分割
1.1 实验设置
为验证方法的有效性与通用性,进行了不同视频目标分割(VOS)设置下的实验。先在两个单目标视频目标分割(O - VOS)数据集上评估模型,再在两个零样本视频目标分割(Z - VOS)数据集上测试,最后进行诊断实验深入分析。
1.2 O - VOS 性能评估
1.2.1 数据集
选用两个知名的 O - VOS 基准数据集:DAVIS 2017 和 Youtube - VOS。DAVIS 2017 有 60 个训练视频和 30 个验证视频,每个视频包含一个或多个标注的目标实例;Youtube - VOS 是大规模数据集,分为训练集(3471 个视频)和验证集(474 个视频),验证集又分为与训练集类别相同的可见子集(65 类)和包含 26 个未见类别的未见子集。
1.2.2 评估标准
遵循 DAVIS 2017 的标准评估协议,报告平均区域相似度 (J) 和轮廓精度 (F)。对于 Youtube - VOS,分别计算可见集和未见集的这两个指标。
1.2.3 定量结果
在 DAVIS 2017 上,模型在在线学习和离线方法下均表现出色,在 (J\&F)(82.8%)、平均 (J)(80.0%)和平均 (F)(85.9%)方面超越所有同期方法,设定了新的最优水平。与几种代表性的在线学习方法相比,在区域相似度和轮廓精度上得分更高。此外,通过平均所有实例的推理时间报告了分割速度和内存使用情况。大多数基于检测的分割方法(如 OSVOS)消耗小的 GPU 内存,但需要较
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



