基于视觉的人类活动识别方法研究
1. 引言
人类活动识别(HAR)在个人和社会互动中极为重要,它是计算机视觉的一个子领域,有很大潜力开发改善生活的解决方案。其目标是识别特定个人或群体的身体活动,让计算机了解人们在特定环境中的行为,从而在各种情况下变得主动。
HAR的应用广泛,如环境辅助生活、病人护理家庭健康监测、康复活动监控以及人机交互等。同时,它在安全解决方案、人机交互和机器人系统等领域也有需求。
人类姿势识别是人类交互的重要方面,也是研究热点。非接触式人机交互的主要目标是识别手势并准确解读意图,通过分析人的行为、节奏、姿势等信息来实现识别。在基于视觉的HAR中,分析相机信号;而基于传感器的方法则识别传感器信号,如加速度计、陀螺仪、雷达和磁力计等。加速度计因成本低、体积小和易于操作,是最常用的HAR传感器。不过,研究表明基于传感器的HAR比基于视觉的HAR更高效且更能保护隐私,因为基于视觉的HAR受采集角度、光照和个体交叉等因素影响较大,难以区分人类活动与静止图像或视频序列。
人类动作具有内在的层次结构,从原子元素(动作基元)构成更复杂的人类动作。“动作”和“活动”在本文中可互换使用,指由单个个体按时间顺序执行的一系列动作基元组成的全身动作。人类活动是人们相互互动的方式,其复杂程度从简单动作到多个事件不等。
2. 基于手工特征的HAR
与全局特征相比,当前大多数局部特征在处理低光照和噪声方面更有效。词袋模型(BoVW)通常与局部特征结合,形成最先进的局部表示技术的通用流程。具体步骤如下:
1. 使用探测器或密集采样获取兴趣点和局部补丁。
2. 从这些兴趣点或补丁中提取局部特征。
3.
超级会员免费看
订阅专栏 解锁全文
17万+

被折叠的 条评论
为什么被折叠?



