人体活动识别与图像检索技术解析
人体活动的组合模型识别
人体活动是复合的,这一证据十分有力。若活动确实是复合的,那么活动标签的数量可能会非常庞大。例如,当动作在时间和身体各部位上组合时,可能会出现双腿行走、左臂摆动、右臂伸展,接着双腿行走且双臂伸展等复杂情况,这会导致显著的复杂性。
对于纯粹的判别方法而言,这会带来棘手的问题,因为可能没有足够大的标签集来表示所有这些复杂性。不过,有些复杂性可能是无关紧要的,比如只想找出站立的人时,就无需表示人们行走时的所有动作。
若有足够的标签集,n - 元姿势直方图是一种可行的表示方法。它能抑制时间细节,同时保留一些顺序信息。另一种方法是构建局部标签如何组合的显式模型。例如,Ikizler 和 Forsyth(2008)为一组基本标签构建身体各部分运动的局部模型,然后将这些模型串联成一个大的隐马尔可夫模型(HMM)。该模型中的局部模型带有标签,可用于查询一组活动视频,以找出那些虽未见过但由有限状态自动机表示的活动。评估序列由有限状态自动机生成的后验概率很容易,并可据此对序列进行排序。
显式的组合表示很有吸引力,因为它能让我们拥有复杂度高但相对易于表示的标签空间。然而,目前的方法存在两个难点:一是需要对身体进行解析,因为组合时必须知道从哪里分割,这使得它们容易受到解析问题的影响;二是难以确定一组好的基本标签。
相关数据集资源
以下是一些与人体活动识别相关的数据集:
| 数据集名称 | 发布者 | 链接 |
| — | — | — |
| Buffy 火柴人数据集 | Ferrari, Eichner, Marín - Jiménez, 和 Zisserm
超级会员免费看
订阅专栏 解锁全文
877

被折叠的 条评论
为什么被折叠?



