Kinect技术:原理、算法与应用
1. Kinect简介
Kinect是微软为其Xbox 360平台开发的视频游戏技术,用户可以通过自然的身体动作来控制游戏。它主要由三个部分组成:
- 传感器:能以帧率提供精确的深度图和彩色图像。
- 姿态估计算法:用于估计每一帧中玩家的姿态(关节位置)。
- 跟踪算法:利用上述信息,随着时间平滑地恢复3D运动学模型(骨骼)的参数(关节角度)。
Kinect在计算机视觉领域取得了巨大成功,截至2011年已售出数百万台。其成功的关键因素包括:
1. 传感器性能 :由Primesense开发的传感器,以30Hz的频率提供VGA分辨率(480×640像素)的深度图和UXGA分辨率(1200×1600像素)的RGB图像。采用Light Coding™技术,通过黑白相机观察投影的红外图案,并在专用芯片上解码。具有速度快、成本低的特点,适合作为大众市场视频游戏套装的一部分。
2. 易于模拟数据 :距离图像比普通照片更容易进行真实模拟,因为它没有颜色、纹理或光照变化。这使得生成合成数据来训练准确的分类器变得容易,且不易过拟合。
3. 投票程序的鲁棒性 :投票程序对单个投票者的错误具有较强的鲁棒性。即使在单个像素级别存在较高的错误率(40%),仍能实现出色的姿态估计结果。
4. 跟踪组件的作用 :Kinect的整体有效性和鲁棒性部分归功于其跟踪组件。虽然具体细节是专有的,但它可以利用时间信息来平滑恢复的骨骼参数,并从关节检测错误中恢复。
此外
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



