Kinect技术原理与应用详解
1. Kinect简介
Kinect是微软为其Xbox 360平台开发的视频游戏技术,允许用户通过自然的身体动作来控制游戏。它主要由三部分组成:能以帧率提供精确深度图和彩色图像的传感器、用于估计每一帧中玩家姿势(关节位置)的有效算法,以及利用这些信息随时间平滑恢复3D运动学模型(骨架)参数(关节角度)的跟踪算法。
Kinect在计算机视觉领域取得了巨大成功,截至2011年已售出数百万台。其成功的关键因素如下:
- 传感器优势 :由Primesense开发的传感器,能以30Hz的频率提供VGA分辨率(480×640像素)的深度图和UXGA分辨率(1200×1600像素)的注册RGB图像。采用Light Coding™技术,通过黑白相机观察投影的红外图案,并在专用芯片上解码。该传感器速度快,远高于传统机械扫描测距仪,且成本低,足以作为大众市场视频游戏套装的一部分。
- 易于模拟数据 :距离图像比普通照片更容易进行真实模拟,因为它没有颜色、纹理或光照变化。这意味着可以轻松生成合成数据来训练准确的分类器,而不会出现过拟合问题。
- 投票程序的鲁棒性 :投票程序对单个投票者的错误具有相对较强的鲁棒性。尽管在单个像素级别存在相对较高的错误率(40%),但仍能实现出色的姿势估计结果。
- 跟踪组件的作用 :Kinect的整体有效性和鲁棒性在一定程度上归功于其跟踪组件。虽然其细节属于专有技术,但与其他跟踪方法一样,它可以利用时间信息来平滑恢复的骨架参数,并从关节检测错误中恢复。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



