活动识别与分类技术全解析
1 引言
活动识别在计算机视觉领域应用广泛,如视觉监控,但在现实场景中面临诸多挑战,如类间差异和杂乱背景等。活动可通过不同特征表示,如轨迹特征、时空特征等,再由活动分类器进行分类以获取活动标签。接下来将介绍一些相关的分类方法和常用数据集。
2 活动分类方法
2.1 分层方法
词袋模型对背景噪声具有鲁棒性,但在处理外观和姿态变化较大的动作时,表达能力不足,且低层次特征与高层次动作之间存在较大语义差距。为解决这些问题,分层方法被提出,其旨在学习额外的表示层,更好地抽象低层次特征用于分类。
分层方法从低层次特征中学习中间层次特征,这些中间特征可视为从训练数据库中发现的知识或由专家指定。近年来,语义描述或属性在活动识别中受到广泛研究,这些语义被定义并引入活动分类器,以表征复杂的人类动作。其他分层方法,如从观察帧中选择关键姿势,也能在模型学习过程中更好地表示活动。
2.2 群体动作分类器
2.2.1 人与人交互
从视频中识别人与人之间的交互是近期研究的热点。以往多数研究采用与单人动作识别相同的方式来识别人与人的交互,即将交互表示为包含视频中所有人的运动描述符,然后使用线性支持向量机等动作分类器进行分类。然而,这些方法未充分利用交互的内在属性,如交互人员之间的共现信息,且将人群视为单一实体,无法同时给出视频中每个交互人员的动作标签。
为获得更准确和鲁棒的识别结果,可利用人类交互中的丰富上下文信息。例如,通过耦合一个人的运动状态与另一个交互人的运动状态来识别人类交互;捕捉时空人群上下文信息,利用人体姿势、速度和个体的时空分布来表示人群上下文信息;还可捕捉
超级会员免费看
订阅专栏 解锁全文
3万+

被折叠的 条评论
为什么被折叠?



