MMPose项目中使用Label Studio进行关键点标注的完整指南-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00358/article/details/148467859

MMPose项目中使用Label Studio进行关键点标注的完整指南

mmpose OpenMMLab Pose Estimation Toolbox and Benchmark. 项目地址: https://gitcode.com/gh_mirrors/mm/mmpose

前言

在计算机视觉领域，人体姿态估计是一项基础且重要的任务。MMPose作为一款优秀的人体姿态估计开源框架，为研究人员和开发者提供了强大的工具。然而，要训练一个高质量的姿态估计模型，首先需要准备高质量的关键点标注数据。本文将详细介绍如何使用Label Studio标注工具为MMPose准备关键点数据，并将其转换为MMPose所需的COCO格式。

Label Studio简介

Label Studio是一款功能强大的开源数据标注工具，支持多种标注任务，包括图像分类、目标检测、语义分割以及关键点标注等。对于人体姿态估计任务，Label Studio提供了灵活的关键点标注功能，可以满足各种复杂场景下的标注需求。

标注前的准备工作

1. 标签接口配置

在开始标注前，我们需要正确配置Label Studio的标签接口。对于MMPose项目，我们需要同时标注三种类型的信息：

关键点(KeyPointLabels)：用于标记人体的各个关节点
多边形区域(PolygonLabels)：用于标记人体的分割区域
矩形框(RectangleLabels)：用于标记人体的边界框

这三种标注类型对应COCO格式中的不同字段，缺一不可。以下是推荐的标签接口配置：

<View>
  <KeyPointLabels name="kp-1" toName="img-1">
      <Label value="person" background="#D4380D"/>
  </KeyPointLabels>
  <PolygonLabels name="polygonlabel" toName="img-1">
      <Label value="person" background="#0DA39E"/>
  </PolygonLabels>
  <RectangleLabels name="label" toName="img-1">
      <Label value="person" background="#DDA0EE"/>
  </RectangleLabels>
  <Image name="img-1" value="$img"/>
</View>

2. 标注顺序的重要性

为了确保转换后的数据格式正确，标注时必须遵循特定的顺序规则：

首先标注关键点：按照MMPose配置文件中定义的关键点顺序进行标注
然后标注区域或边界框：可以选择标注多边形区域或矩形框，或者两者都标注

这种顺序要求是因为转换脚本需要通过标注顺序来判断哪些标注属于同一个实例。如果顺序错误，可能会导致关键点与对应的区域/边界框不匹配。

标注过程中的注意事项

1. 关键点标注规范

确保关键点的数量与MMPose配置文件中定义的数量一致
关键点的顺序必须与配置文件中的顺序完全匹配
对于不可见的关键点，可以标记为"不可见"状态

2. 区域和边界框标注技巧

多边形区域应尽可能精确地勾勒出人体的轮廓
矩形框应完整包含整个人体，但不要过大
可以只标注多边形或矩形框中的一种，但建议两者都标注以获得更完整的信息

3. 图像文件管理

避免使用过长的文件名，因为Label Studio可能会截断长文件名
建议使用有意义的命名规则，便于后期管理
保持原始图像的高质量，避免压缩导致的细节丢失

数据导出与转换

1. 导出标注数据

完成标注后，按照以下步骤导出数据：

在Label Studio项目界面点击"Export"按钮
选择"JSON"格式
点击"Export"下载标注文件

注意：导出的JSON文件仅包含标注信息，不包含原始图像。需要单独准备图像文件。

2. 使用转换脚本

MMPose提供了专门的转换脚本labelstudio2coco.py，可以将Label Studio的标注格式转换为COCO格式。使用方法如下：

python tools/dataset_converters/labelstudio2coco.py config.xml project-annotations.json output/result.json

参数说明：

config.xml：标签接口配置文件
project-annotations.json：从Label Studio导出的标注文件
output/result.json：输出的COCO格式文件路径

3. 最终数据集结构

转换完成后，数据集应具有以下结构：

数据集目录/
├── images/          # 存放所有图像文件
│   ├── img1.jpg
│   └── img2.jpg
└── result.json     # COCO格式的标注文件

在MMPose中使用转换后的数据

转换完成后，可以在MMPose配置文件中这样引用数据集：

dataset=dict(
    type='CocoDataset',  # 数据集类型
    data_root='数据集目录',  # 数据集根目录
    data_mode='topdown',  # 数据模式(topdown或bottomup)
    ann_file='result.json',  # 标注文件路径
    data_prefix=dict(img='images/'),  # 图像路径前缀
    pipeline=train_pipeline,  # 数据预处理流程
)