MMPose 模型推理指南：从入门到实践

陶羚耘Ruby

于 2025-06-06 09:22:02 发布

阅读量353

点赞数 4

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_01162/article/details/148467854

MMPose 模型推理指南：从入门到实践

mmpose OpenMMLab Pose Estimation Toolbox and Benchmark. 项目地址: https://gitcode.com/gh_mirrors/mm/mmpose

一、MMPose 推理概述

MMPose 作为一款强大的姿态估计工具包，提供了多种推理方式以满足不同场景的需求。本文将详细介绍 MMPose 的两种主要推理接口：统一的推理器接口和灵活的推理 API。

二、统一推理器接口

2.1 基本使用流程

MMPoseInferencer 是 MMPose 提供的统一推理接口，其使用流程简单明了：

初始化推理器
输入图像/视频
获取推理结果

from mmpose.apis import MMPoseInferencer

# 初始化推理器（使用人体姿态估计模型）
inferencer = MMPoseInferencer('human')

# 执行推理
img_path = 'example.jpg'
result_generator = inferencer(img_path, show=True)
result = next(result_generator)

2.2 结果解析

推理结果以字典形式返回，包含两个关键部分：

result = {
    'visualization': [vis_image],  # 可视化结果列表
    'predictions': [               # 预测结果列表
        [
            {   # 每个检测实例的详细信息
                'keypoints': ...,  
                'keypoint_scores': ...,
                ...
            },
            ...
        ]
    ]
}

2.3 多输入处理

推理器支持多种输入类型：

单张图像
视频文件
图像文件夹
摄像头实时输入

对于多帧输入，建议使用生成器方式处理：

folder_path = 'images/'
result_generator = inferencer(folder_path)
results = [result for result in result_generator]

三、模型自定义配置

3.1 模型指定方式

MMPose 支持多种模型指定方式：

# 方式1：使用模型别名
inferencer = MMPoseInferencer('human')

# 方式2：使用配置名称
inferencer = MMPoseInferencer('rtmpose-m_8xb256-420e_coco-256x192')

# 方式3：完整配置文件路径
inferencer = MMPoseInferencer(
    pose2d='configs/body_2d_keypoint/rtmpose/coco/rtmpose-m.py',
    pose2d_weights='checkpoints/rtmpose-m.pth'
)

3.2 检测模型配置

对于需要检测模型的姿态估计方法，可以单独配置检测器：

inferencer = MMPoseInferencer(
    pose2d='human',
    det_model='yolox_l_8x8_300e_coco',
    det_cat_ids=[0]  # 指定检测类别
)

四、结果保存与可视化

4.1 结果保存

# 保存预测结果（JSON格式）
inferencer(img_path, pred_out_dir='predictions')

# 同时保存可视化结果和预测数据
inferencer(img_path, out_dir='output')

目录结构将自动生成：

output/
├── predictions/  # 预测结果
└── visualization/  # 可视化图像

4.2 可视化定制

# 调整可视化样式
inferencer(img_path, 
           show=True,
           radius=5,        # 关键点半径
           thickness=2,     # 骨架线宽
           kpt_thr=0.3,     # 关键点阈值
           draw_bbox=True)  # 绘制边界框

五、高级推理API

对于需要更灵活控制的场景，可以使用底层API：

5.1 模型初始化

from mmpose.apis import init_model

model = init_model(
    'configs/body_2d_keypoint/rtmpose/coco/rtmpose-m.py',
    'checkpoints/rtmpose-m.pth',
    device='cuda'
)

5.2 执行推理

from mmpose.apis import inference_topdown

results = inference_topdown(model, img_path)

5.3 结果可视化

from mmpose.apis import visualize
from mmpose.registry import VISUALIZERS

# 初始化可视化器
visualizer = VISUALIZERS.build(model.cfg.visualizer)
visualizer.set_dataset_meta(model.dataset_meta)

# 可视化结果
visualizer.add_datasample(
    'result',
    image,
    data_sample=results[0],
    show=True
)