OpenPI项目远程推理服务部署与使用指南-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00408/article/details/148577652

OpenPI项目远程推理服务部署与使用指南

openpi 项目地址: https://gitcode.com/gh_mirrors/op/openpi

远程推理服务概述

OpenPI项目提供了远程运行模型的实用工具，这种架构设计具有以下优势：

计算资源解耦：可以在高性能GPU服务器上运行推理，降低机器人本地的计算负担
环境隔离：避免机器人软件环境与策略环境之间的依赖冲突
灵活部署：支持多种机器人环境(DROID/ALOHA/LIBERO)的模型服务化

服务端部署

预训练模型服务启动

对于OpenPI提供的预训练模型，启动服务非常简单：

uv run scripts/serve_policy.py --env=[DROID | ALOHA | LIBERO]

其中env参数指定要加载的π₀检查点对应的环境类型。

自定义模型服务启动

如需部署自行训练的模型，可以使用完整参数配置：

uv run scripts/serve_policy.py policy:checkpoint \
    --policy.config=pi0_fast_droid \
    --policy.dir=s3://openpi-assets/checkpoints/pi0_fast_droid

关键参数说明：

policy.config: 指定模型配置
policy.dir: 模型检查点存储路径
默认服务端口为8000，可通过--port参数修改

客户端集成

环境准备

首先需要在机器人环境中安装轻量级客户端包：

cd $OPENPI_ROOT/packages/openpi-client
pip install -e .

客户端使用示例

以下是一个完整的客户端集成代码示例：

from openpi_client import image_tools
from openpi_client import websocket_client_policy

# 初始化策略客户端
client = websocket_client_policy.WebsocketClientPolicy(
    host="localhost",  # 服务端IP
    port=8000         # 服务端端口
)

for step in range(num_steps):
    # 构建观测数据
    observation = {
        # 主摄像头图像处理
        "observation/image": image_tools.convert_to_uint8(
            image_tools.resize_with_pad(img, 224, 224)
        ),
        # 腕部摄像头图像处理
        "observation/wrist_image": image_tools.convert_to_uint8(
            image_tools.resize_with_pad(wrist_img, 224, 224)
        ),
        # 本体感知状态(无需预处理)
        "observation/state": state,
        # 任务指令
        "prompt": task_instruction,
    }

    # 调用远程策略获取动作序列
    action_chunk = client.infer(observation)["actions"]
    
    # 执行动作
    ...

关键实现细节

图像预处理：
- 使用resize_with_pad将图像统一调整为224x224尺寸
- 通过convert_to_uint8确保图像数据格式与训练时一致
- 这些预处理可减少网络传输数据量
动作执行策略：
- 服务端返回的是动作序列块(action chunk)
- 通常不需要每步都调用策略，可以间隔N步调用一次
- 在间隔步中开环执行已预测的动作序列
状态数据处理：
- 本体感知状态(state)可直接传递原始数据
- 服务端会自动进行标准化处理