基于亿像素图像的人群重建技术解析
在计算机视觉领域,人群重建是一个具有挑战性但又极具价值的研究方向。尤其是在大场景下对数百人的姿态、形状和 3D 位置进行重建,对于场景理解和人群分析有着重要意义。接下来,我们将深入探讨相关技术。
1. 机器人导航与人群重建的背景
传统的机器人导航方法通常将行人视为简单的圆形障碍物,依据行人当前位置进行避障。例如“Direct - S”方法将行人当作小圆形障碍物,常导致机器人干扰行人;“Direct - L”方法把行人视为大圆形障碍物,降低了导航效率,导致路径变长。而提出的基于 GIF 的机器人导航方法,赋予机器人类似人类的预测能力,能根据行人的空间场和注意力场自适应规划路径,有效避免行人干扰,同时保持机器人的行驶效率。
2. 大场景人群重建的挑战
大场景下单目多人重建存在两大挑战:
- 人员规模和尺度差异 :大场景中有大量不同尺度的人员,这使得重建时难以统一处理。
- 深度模糊问题 :单视图下深度信息模糊,难以准确估计人员的绝对 3D 位置。
3. 经典人群重建方法
人群 3D 姿态估计方法主要分为自上而下和自下而上两种范式:
- 自上而下范式 :先检测人员,再分别估计每个人的 3D 姿态。如 Moon 等人在检测人员后分别估计根位置和根相对姿态;HMOR 将人类关系分为三个层次并制定成对顺序关系。
- 自下而上范式 :直接检测所有关节并进行分组。例如 SMAP 利用深度卷积神经网络估计根深
超级会员免费看
订阅专栏 解锁全文
9478

被折叠的 条评论
为什么被折叠?



