动作识别与人类交互研究
1. 交互短语概述
交互短语可用于描述人与人之间的语义运动关系。以下是一些常见的交互短语示例:
|身体部位|交互短语|
| ---- | ---- |
|手臂|胸部水平移动的手臂、自由摆动的手臂|
|躯干|前倾的躯干、后倾的躯干|
|腿部|向前迈步的腿、向后迈步的腿|
这些交互短语能描述交互的重要细节,彼此提供强大的上下文信息,比以往的动作上下文更具表现力。它可以构建更具描述性的模型,用于识别具有较大变化的人类交互,例如部分遮挡的交互情况。
交互短语与对象和动作的属性有相似之处,它们都是描述性的基本元素,能将高级语义知识引入预测模型。但不同的是,属性代表对象的一元关系(即对象的内在属性),而交互短语描述的是人与人之间的二元运动关系,是基于每个交互者的语义运动属性构建的。交互短语还可被视为活动基元,有助于识别新的交互类别,并且作为中级特征,弥合了低级特征和高级交互之间的语义差距。
2. 相关工作
以往大量的人类动作识别工作主要集中在识别视频中单人的动作。多数研究将交互识别与单人动作识别采用相同的方式,即把交互表示为包含视频中所有人的运动描述符,然后使用动作分类器进行分类。这种方法虽然能取得一定性能,但未利用交互的内在属性,如交互者之间的共现信息,也未提取群体中每个人的运动,无法同时给出视频中每个交互者的动作标签。
一些研究利用人类交互中的丰富上下文信息以获得更准确和稳健的结果:
- 通过耦合一个人的运动状态与另一个交互者的运动状态,利用运动共现来识别交互。
- 捕捉时空人群上下文来识别交互。
- 利用结构化学习技术捕
超级会员免费看
订阅专栏 解锁全文
16万+

被折叠的 条评论
为什么被折叠?



