近期有两篇来自于同一第一作者单位的工作,使用基于神经网络的图像变换模型来处理不同视角、不同衣着或手持物的CEI特征到统一的90°正常特征(SPAE与GaitGAN)。在这里加以简单总结与对比。
[Neurocomputing 17] Invariant feature extraction for gait recognition using only one uniform model
Shiqi Yu, Haifeng Chen, Qing Wang, Linlin Shen, Yongzhen Huang
from Shenzhen University and CAS-IA
这篇文章使用自动编码器(Auto-encoder)来去除来自于CL(大衣)和BG(手持包)的CEI中的影像识别的因素,之后将不同视角的CEI特征转换到统一的视角(side view = 90°)。
直接进行转换会使得任务变得很困难。本文采用了divide-and-conquer思想将变换过程进行拆分,分布训练编码器,再进行叠加。
作者设计的编码器首先处理CL和BG特征到正常的NM CEI。其中CL到NM的变换通过1层网络即完成变换,而BG到NM需要通过2层网络的变换。