BigGait: Learning Gait Representation You Want by Large Vision Models阅读笔记

文章提出了一种名为BigGait的新框架,利用LVM生成的多用途知识和无监督方法,通过GRE转换步态序列图,实现了高效的步态表征。在self-domain和cross-domain任务上达到SOTA性能,尤其在减少背景噪声和提高泛化性方面有所突破。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

于老师团队又有新作!!

0 Abstract

  • 现有的步态识别任务严重依赖上游任务所使用的多种显示步态表征(剪影图、姿态图、点云…),会导致严高额标注成本以及累计错误;
  • 文章提出了BigGait框架:
    • 挖掘基于多用途知识(all-purpose knowledge)的高效步态表征;
    • GRE(Gait Representation Extractor)将步态序列图通过无监督方式转化为隐式步态特征;
    • 在大部分的self-domain和cross-domain任务上取得sota。
      [图片]

1 Introduction

  • 目前,多数步态识别的方法有以下流程:
    • 首先使用上游模型对RGB的人体步态序列进行过滤,目的是去除无关背景等的影响;
    • 其次使用一些归纳偏置对步态表征进行精炼,例如size alignment、coordinate normalization;
  • 与以往的方式不同,文章基于Large Vision Models产生的task-agnostic knowledge隐式地构建步态表征,这受启发于:
    • LVM产生的多用途特征具有强大的判别性和泛化性;
    • LVM的自监督预训练避免了对特定任务的上游模型对使用,从而需不要昂贵的数据标
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值