视频中的人类动作识别与图像分类新方法
1. 人类动作识别方法
在人类动作识别领域,一种基于结构信息与时空特征融合的新方法被提出。该方法旨在评估结构信息与时空特征在重要分类任务中的融合效果,而非单纯追求更高的动作识别准确率。
1.1 实验结果
在KTH数据集上进行实验,通过改变外观和结构组件的权重($W_a$和$W_s$),得到不同的测试准确率,具体数据如下表所示:
| $W_a$ | $W_s$ | 测试准确率(%) |
| — | — | — |
| 1.0 | 0.0 | 85.7 |
| 0.9 | 0.1 | 85.9 |
| 0.8 | 0.2 | 86.8 |
| 0.7 | 0.3 | 87.9 |
| 0.6 | 0.4 | 88.9 |
| 0.5 | 0.5 | 89.8 |
| 0.4 | 0.6 | 87.9 |
| 0.3 | 0.7 | 85.8 |
| 0.2 | 0.8 | 82.2 |
| 0.1 | 0.9 | 77.9 |
| 0.0 | 1.0 | 48.7 |
从表中可以看出,当$(W_a, W_s) = (0.5, 0.5)$时,识别准确率达到最高。这表明将结构信息与时空特征相结合,能够显著提高识别准确率。
1.2 方法原理
该方法使用图嵌入提供的结构信息和STIP描述符提供的局部时空信息,通过修改后的具有多个独立观测的隐马尔可夫模型(HMM - MIO)进行联合建模。虽然该方法目前尚未超越现有技术的准确率,但它证明了结构特征和时空特征可以有
动作识别与图像分类新方法
超级会员免费看
订阅专栏 解锁全文
24万+

被折叠的 条评论
为什么被折叠?



