语义图像与视频标注工具综述
1. 特定视频标注工具介绍
除了前面提到的语义视频标注工具外,还有一些针对特定应用场景的标注系统,下面简要介绍几个有代表性的工具。
- SVAT :支持对人物、地点、事件、物体等进行描述,标注可以针对镜头(视频片段)或区域级别。在关键帧(或其他帧)中定位特定区域,可手动使用提供的边界框和多边形绘制工具,也可采用自动图像分割。确定感兴趣对象的位置后,SVAT 提供自动匹配服务,以检测整个视频中的相似对象,检测结果会在单独的关键帧视图中显示,其中检测到的对象会被高亮显示。用户可通过移除不相关的关键帧来部分优化匹配结果,但不支持对检测区域的边界或位置进行更复杂的编辑。为特定区域输入的标注可以通过一次鼠标点击复制到视频中所有匹配的对象上,从而大大减少手动标注时间。所有视图,包括镜头视图树结构,都可以导出为 CSV 文件,元数据则保存为 MPEG - 7 XML 文件,且 SVAS 是公开可用的。
- Vannotea :由昆士兰大学开发,用于视频内容的协作索引、浏览、标注和讨论。与其他标注工具不同,它主要侧重于为协作、实时、同步的视频会议服务提供支持。出于互操作性考虑以及对简单灵活标注的需求,采用了基于 XML 的描述方案。基于对 MPEG - 7 和都柏林核心描述的简化翻译,Vannotea 元数据可通过 XSLT 轻松转换为相应的标准化表示。它基于 Annotea 倡议,该倡议是 W3C 的一项活动,旨在促进网络上元数据的共享,采用基于 RDF 的标注方案和 XPointer 来定位标注资源中的标注。
- ProjectPad