视频行为识别之概念介绍和基本的数据集介绍

本文介绍了视频行为识别的基本概念,包括动作分类和复杂识别,并探讨了其在智能监控、人机交互等多个领域的应用。接着,概述了视频行为识别的基本过程,涉及CNN网络和迁移学习。最后,列举并简述了UCF101、HMDB51、MSR Action 3D、HDM05和SBU Kinect Interaction Dataset等常用数据集。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

引言
如今人体行为识别是计算机视觉研究的一个热点,
人体行为识别的目标是从一个未知的视频或者是图像序列中自动分析其中正在进行的行为,基本上分为两类:
(1)简单的行为识别即动作分类,给定一段视频,只需将其正确分类到已知的几个动作类别,
(2)复杂的识别是视频中不仅仅只包含一个动作类别,而是有多个,
系统需自动的识别出动作的类别以及动作的起始时刻。
行为识别的最终目标是分析视频中:
哪些人(who)、在什么时刻(when)、什么地方(where)、干什么事情(what)。即所谓的“W4系统”
人体行为识别应用背景很广泛,主要集中在智能视频监控,病人监护系统,人机交互,虚拟现实,智能家居,智能安防,运动员辅助训练,另外基于内容的视频检索和智能图像压缩等有着广阔的应用前景和潜在的经济价值和社会价值,其中也用到了不少行为识别的方法。

问题提出背景
目标:给定一段视频,通过分析,得到里面人员的动作行为。
问题:可以定义为一个分类问题,通过对预定的样本进行分类训练,解决一个输入视频的多分类问题。
这里提出的问题是简单的图片(视频)分类问题,该问题的前提条件是:场景目标为单人,并且占据图片比较大的比例,如下图所示:

在这里插入图片描述

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值