于老师团队又有新作!!
0 Abstract
- 现有的步态识别任务严重依赖上游任务所使用的多种显示步态表征(剪影图、姿态图、点云…),会导致严高额标注成本以及累计错误;
- 文章提出了BigGait框架:
- 挖掘基于多用途知识(all-purpose knowledge)的高效步态表征;
- GRE(Gait Representation Extractor)将步态序列图通过无监督方式转化为隐式步态特征;
- 在大部分的self-domain和cross-domain任务上取得sota。
1 Introduction
- 目前,多数步态识别的方法有以下流程:
- 首先使用上游模型对RGB的人体步态序列进行过滤,目的是去除无关背景等的影响;
- 其次使用一些归纳偏置对步态表征进行精炼,例如size alignment、coordinate normalization;
- 与以往的方式不同,文章基于Large Vision Models产生的task-agnostic knowledge隐式地构建步态表征,这受启发于:
- LVM产生的多用途特征具有强大的判别性和泛化性;
- LVM的自监督预训练避免了对特定任务的上游模型对使用,从而需不要昂贵的数据标