24、人类动作识别与评估:技术、实验与展望

人类动作识别与评估:技术、实验与展望

1. 深度神经网络架构

在人类动作识别领域,采用了带有Gamma - GWR网络的深度神经网络架构用于持续动作识别。该架构中,姿势和动作线索分别在腹侧通路(VP)和背侧通路(DP)进行处理。在STS阶段,循环GWR网络学习原型动作表示与符号标签之间的关联连接。

深度架构通过交替使用特征检测器层和非线性池化神经元来获得不变响应,例如采用最大(MAX)操作。与线性求和相比,MAX操作能实现更高的特征特异性和更稳健的不变性。通过MAX和平均池化可获得对平移的稳健不变性,其中MAX算子收敛更快,泛化能力更强。

在该架构中,每个Gamma - GWR网络之后都实现了MAX池化层。对于每个输入图像块,在第n - 1层计算最佳匹配神经元$w_{b}^{(n - 1)}\in R^{m}$,并仅将其最大权重值$\hat{w}^{(n)}\in R$传递到下一层n:
$\hat{w}^{(n)} = \max_{0\leq i\leq m} w_{b,i}^{(n - 1)}$
这里,b根据特定公式计算,$\hat{w}^{(n)}$上的上标表示该值不是第n层的实际神经权重,而是来自第n - 1层的池化激活值,将用作第n层的输入。由于神经元的空间感受野沿层次结构增加,这种池化过程将产生尺度和位置不变性。

2. 数据集与评估

为了评估该架构的性能,使用了两个动作基准数据集:Weizmann和KTH数据集。

2.1 Weizmann数据集
  • 数据集内容 :包含90个低分辨率图像序列,由9个受试者执行10种动作
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值