【论文笔记】CVPR2020 Disentangling and Unifying Graph Convolutions for Skeleton-Based Action Recognition

该论文提出了一种解决骨架动作识别中长距离关系学习难题的方法,包括分离的多尺度聚合方案和统一的空间-时间图卷积模块(G3D)。通过创新的图卷积计算方式,有效处理了节点间距离对权重的影响,并增强了时空关系的学习。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

使用GCN进行skeleton-based action recognition
在这里插入图片描述

Contribution

提出了两个设计:

  • a disentangled multi-scale aggregation scheme
  • a unified spatial-temporal graph convolutional module (G3D)

分别解决了两个问题:

  • unbiased weight problem: edge weights will be biased towards closer nodes against further nodes,对于距离较远的两个节点,他们之间的feature share的效果比较轻微,由于距离太远,weight很难传过去。学习long-range relationship比较困难。例如:scale = 7,真正到距离为7的节点的几率是很小的 (这里没有完全理解)。(原始的multi-scale GCN见paper Actional-Structural Graph Convolutional Networks for Skeleton-based Action Recognition
  • factorised spatial-temporal relationship learning: A typical approach is to extract spatial relationships at each time step and then model temporal dy
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值