3D CNN在体育手势识别中的应用
在视频动作识别领域,3D CNN发挥着重要作用,尤其是在体育手势识别方面。下面将介绍相关的数据集以及一种名为TSTCNN的解决方案。
野外数据集
“野外”数据集意味着视频来自不同的来源,可能由专业人士或业余爱好者录制。这些视频可能包含相机运动、强烈模糊、遮挡等,增加了动作识别的难度,但也包含了大量背景信息,可用于训练分类模型。
- UCF数据集
- UCF - Sports :包含来自九个不同体育项目的各种序列,如“跳水”“高尔夫挥杆”等,共10个类别。最初有200个序列,后来减少到150个,图像分辨率为740×480,帧率为10 fps。
- UCF11(UCF YouTube Action) :由在线视频平台YouTube的1160个视频组成,包含11个类别。
- UCF50 :是UCF11的扩展,共有50个动作类别。
- UCF101 :包含101个动作类别,可分为五个领域,如“人与物体交互”“仅身体运动”等。从2500个“野外”视频中构建,提取了13,320个剪辑,每个类别至少有101个剪辑。该数据集广泛应用于科学界,并催生了2013 - 2015年的THUMOS挑战。
- Kinetics数据集 :包括Kinetics - 400、Kinetics - 6
超级会员免费看
订阅专栏 解锁全文
1431

被折叠的 条评论
为什么被折叠?



