概要
PKU-MMD 是用于连续多模态 3D 人体动作理解的新型大规模基准,涵盖了具有良好注释信息的广泛复杂人体活动。PKU-MMD 包含两个阶段,针对难度不断增加的动作检测任务。第 1 阶段是大边距动作检测任务。第 2 阶段是小边距动作检测任务。我们的数据集还提供多模态数据源,包括 RGB、深度、红外辐射和骨架。我们相信这个大规模数据集将有利于社区未来的动作检测研究。
数据集描述
PKU-MMD 是我们新的大规模数据集,专注于长连续序列动作检测和多模态动作分析。该数据集通过 Kinect v2 传感器捕获。
第一阶段包含 51 个动作类别中的 1076 个长视频序列,由 66 个受试者在三个摄像机视图中执行。它包含近 20,000 个动作实例和总共 540 万帧。每个视频持续约 3-4 分钟(录制比率设置为 30 FPS),包含大约 20 个动作实例。我们数据集的总规模为 5,312,580 帧,3,000 分钟,包含 21,545 个时间局部动作。
我们总共选择了 51 个动作类别,分为两部分:41 个日常动作(喝水、挥手、戴上玻璃杯等)和 10 个交互动作(拥