RTMPose
1. 人体姿态估计简介
- 多人姿态估计框架包括5个方面:
- paradigm:范式
- top-down:
- 用于人数不多于6人的场景
- 使用现成的检测器提供边界框,然后将人体裁剪为统一的尺度进行姿势估计
- 人体检测器和位姿估计器可输入较小的分辨率
- bottom-up:
- 自下而上的范式被认为适合人群场景,因为随着人数的增加,计算成本保持稳定;
- 通常需要较大的输入分辨率来处理不同的人的尺度,这使得协调准确性和推理速度变得具有挑战性
- top-down:
- backbone network:骨干网络
- localization method:定位算法
- 坐标回归(coordinate regression)
- 热图回归(heatmap regression)
- 坐标分类(coordinate classification)
- 子像素箱分类(将关键点预测看作为分别针对水平和垂直坐标的子像素箱的分类)
- 代表算法:SimCC
- 摆脱了对高分辨率热图的依赖,因此可以实现非常紧凑的架构,既不需要高分辨率中间表示,也不需要昂贵的上采样层
- 展平最终的特征图进行分类,不需要全局池化,从而避免了空间信息的丢失
- 通过亚像素尺度的坐标分类可以有效缓解量化误差,无需额外的优化后处理
- training strategy:训练策略
- deployme
- paradigm:范式

最低0.47元/天 解锁文章
2274





