一、概述
视频可能很难处理,收集数据比较难,训练需要资源更多,最终训练完能达到的效果通常不会是一个让人觉得十分不错的程度。但是视频分析领域变得越来越重要,更多的科技企业持续投入,更多新的模型算法不算的推出。
这里我们先进行视频分类的了解,视频分类问题与图像分类问题没有太大不同。主要是一帧图像和一些列图像的差异。
对于图像分类任务,我们获取图像,使用特征提取器(如卷积神经网络或 CNN)从图像中提取特征,然后根据这些提取的特征对该图像进行分类。对于视频分类,我们首先从给定视频中提取帧。然后,我们可以遵循与图像分类任务相同的步骤。这是处理视频数据的最基本的方法。
这里的方法实际上还是单帧图像进行训练分类。
二、数据集
1、数据集概述
这里使用UCF101 - 动作识别数据集,该数据集由属于 101 个不同类别的 13,