基于机器学习的人类行为识别技术综述
1. 引言
在计算机视觉领域,人类活动识别(HAR)是一个备受关注的重要话题。随着视频录制数量的呈指数级增长,以及众多使用定时视频测试的应用的出现,如视觉监控、人机界面、视频查询和视频恢复等,HAR 尤其是异常状态动作识别,展现出了巨大的应用潜力。
人类动作通常根据多样性可分为四个阶段:手势、行为、交互和群体活动。手势是身体部位的基本运动,如握手和面部表情,通常持续时间短且复杂度低;行为是个体进行的活动,如跑步、骑自行车等,是各种手势的组合;交互包括人与人或人与物体的互动,如打架、使用 ATM 等;群体活动则最为复杂,涉及多人和物体,如抗议、团队比赛等。
在过去十年中,机器学习方法在计算机视觉领域得到了广泛应用,但目前尚无明确的机器学习方法框架。本文将对各种机器学习方法进行评估和分类,探讨用于人类活动识别的最佳机器学习方法,并介绍相关的公开数据集。
2. 人类活动识别的机器学习:机遇与挑战
近年来,自动或功能识别一直是计算机视觉领域的难题之一,它对于视频监控、计算机游戏、机器人技术和人机交互等众多人工智能应用至关重要。
一个典型的动作认证系统包括三个关键步骤:特征提取、动作表示和分类。每个步骤对于实现正确的识别率都至关重要,合适的特征提取和分类方法将极大地影响最终结果。近年来,已经开始采用机器学习方法直接从源视频数据中学习高级表示。
3. 基于视觉的动作识别方法
基于视觉的动作识别方法通常分为两类:
3.1 手工特征表示方法
这是人类活动识别的下游技术,主要基于手工特征表示。通过特征设计的特征检
超级会员免费看
订阅专栏 解锁全文
3844

被折叠的 条评论
为什么被折叠?



