基于对数欧几里得黎曼度量的人体动作识别
1. 动作识别框架概述
提出的动作识别框架可直接处理输入的未分割图像序列,以识别诸如行走、跑步或拍手等低级动作。该识别系统无需任何预处理,而其他一些方法存在共同局限,即必须事先获取并调整每个人的以人物为中心的时空体积或轮廓至固定大小,然而物体分割和跟踪在计算机视觉中是一项艰巨任务。
框架流程如下:
graph LR
A[输入未分割图像序列] --> B[使用Dollár等人的检测器检测每帧中的长方体]
B --> C[提出新描述符提取长方体的有效特征]
C --> D[使用k - 均值聚类方法对训练视频中基于对数欧几里得黎曼度量的特征进行量化,形成外观码本(即BOVW)]
D --> E[每个视频样本最终表示为BOVW的直方图]
E --> F[测试阶段,测试视频也表示为BOVW的直方图]
F --> G[使用EMD进行测试视频与训练视频的直方图匹配]
G --> H[根据最近分类准则对测试视频进行分类]
在后续内容中,将详细介绍描述符以及基于EMD的直方图匹配。
2. 描述符
一个好的动作识别描述符应满足以下条件:
- 尺度不变性
- 相机视角不变性
- 旋转不变性
- 对部分遮挡的鲁棒性
- 对光照变化不敏感
- 对类内样本间的大几何变化具有容忍性
基于此,提出的新颖描述符基于对数欧几里得黎曼度量,与以往方法有很大不同
超级会员免费看
订阅专栏 解锁全文
19

被折叠的 条评论
为什么被折叠?



