Cross-view action recognition 训练集动作是在一个视角下观察的,而测试集是在不同的视角下,因此由于不同动作在不同视角下的类内差异比同一视角下的类间差异大,因此Cross-View动作识别是比较有挑战性的研究方向。
目前解决这一问题的方法,传统方法主要有以下几种:
通过3D重建( 3D reconstruction),建立不依赖视角的人体3D模型。
寻找对视角变化不敏感的动作特征表示.比如时域自相似性描述子(temporal self-similarity descriptors [1]) 以及视角的流形表示 the view-style independent manifold representation[2]。wu[3] 提出了一种潜在核结构的SVM算法,视角在模型中作为潜在变量,通过训练和测试阶段去推测。
基于 transfer learning的方法.通过探索统计特性之间的关联,调整一个视角或者多个视角下(source view)学到的knowledge,到不同的视角下(target view).