多视角活动与非语言交流数据集及广域持久机载视频分析
1. VideoWeb数据集介绍
在视频活动识别研究中,缺乏标注的视频数据集是一个常见问题,现有的数据集也很少关注多人之间的非语言交流(NVC)以及提供多视角的活动画面。VideoWeb活动数据集旨在填补这一空白。
1.1 数据收集
- 收集时长与场景 :该数据集在四天内收集完成,使用了VideoWeb相机网络中的37个室外无线摄像头的子集。共包含51个标注场景,每天的场景数量在6 - 18个之间,每个场景平均时长约4分钟。
- 场景特点 :前三天的场景由一系列人类活动和动作组成连续的故事情节,部分场景还存在人与物体的交互。第四天的场景则涉及多人与多辆车的交互,摄像头采用从15英尺到70英尺高空的俯视视角,模拟无人机的特写画面。
| 日期 | 场景数量 | 摄像头数量 | 视频中是否有车辆 |
|---|---|---|---|
| 第一天 | 8 | 4 | 否 |
| 第二天 | 19 | 8 | 否 |
| 第三天 | 18 | <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



