方案概览
本文档从模型部署的环境配置、模型转换、模型推理等方面进行介绍moondream2模型在ModelArts DevServer上部署,支持NPU推理场景。
本方案目前仅适用于部分企业客户,完成本方案的部署,需要先联系您所在企业的华为方技术支持。
资源规格要求
推理部署推荐使用DevServer资源和Ascend Snt9B单机单卡。
名称 |
版本 |
---|---|
CANN |
cann_8.0.rc1 |
PyTorch |
pytorch_2.1.0 |
获取镜像
分类 |
名称 |
获取路径 |
---|---|---|
基础镜像 |
西南-贵阳一:swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2.1.0-cann_8.0.rc1-py_3.9-hce_2.0.2312-aarch64-snt9b-20240516142953-ca51f42 |
从SWR拉取。 |