ZML项目模型容器化部署指南-优快云博客

ZML项目模型容器化部署指南

【免费下载链接】zml Any model. Any hardware. Zero compromise. Built with @ziglang / @openxla / MLIR / @bazelbuild 项目地址: https://gitcode.com/gh_mirrors/zm/zml

前言

在现代机器学习工程实践中，容器化技术已成为模型部署的标准方式。本文将详细介绍如何在ZML项目中使用Bazel构建工具将模型打包为Docker容器镜像，实现模型的便捷部署。

容器化基础概念

容器化是将应用程序及其依赖项打包到一个标准化单元中的过程，这个单元可以在任何支持容器运行时的环境中运行。对于机器学习模型而言，容器化可以确保：

运行环境一致性
依赖项隔离
便捷的部署和扩展
跨平台兼容性

准备工作

在开始之前，请确保：

已安装Docker或Podman等容器运行时
熟悉Bazel构建系统基础
了解ZML项目的基本结构

简单模型容器化步骤

1. 修改BUILD.bazel文件

首先需要在模型的BUILD.bazel文件中添加必要的规则导入：

load("@aspect_bazel_lib//lib:tar.bzl", "mtree_spec", "tar")
load("@aspect_bazel_lib//lib:transitions.bzl", "platform_transition_filegroup")
load("@rules_oci//oci:defs.bzl", "oci_image", "oci_load", "oci_push")
load("@zml//bazel:zig.bzl", "zig_cc_binary")

2. 创建清单文件

清单文件指定了需要包含在容器中的所有内容：

mtree_spec(
    name = "mtree",
    srcs = [":simple_layer"],
)

3. 构建TAR归档

使用高压缩比的zstd算法创建TAR归档：

tar(
    name = "archive",
    srcs = [":simple_layer"],
    args = ["--options", "zstd:compression-level=9"],
    compress = "zstd",
    mtree = ":mtree",
)

4. 构建容器镜像

创建OCI格式的容器镜像并指定目标平台：

oci_image(
    name = "image_",
    base = "@distroless_cc_debian12",
    entrypoint = ["./{}/simple_layer".format(package_name())],
    tars = [":archive"],
)

platform_transition_filegroup(
    name = "image",
    srcs = [":image_"],
    target_platform = "@zml//platforms:linux_amd64",
)

5. 加载和运行镜像

添加加载规则后即可运行容器：

oci_load(
    name = "load",
    image = ":image",
    repo_tags = ["distroless/simple_layer:latest"],
)

构建并运行命令：

bazel run --config=release //simple_layer:load
docker run --rm distroless/simple_layer:latest

6. 推送镜像到仓库

添加推送规则后即可发布镜像：

oci_push(
    name = "push",
    image = ":image",
    remote_tags = ["latest"],
    repository = "index.docker.io/renerocksai/simple_layer",
)

包含权重文件的模型容器化

对于需要额外数据文件（如模型权重）的情况，容器化过程略有不同。

1. 修改BUILD.bazel

需要添加数据依赖和参数：

zig_cc_binary(
    name = "mnist",
    args = [
        "$(location @com_github_ggerganov_ggml_mnist//file)",
        "$(location @com_github_ggerganov_ggml_mnist_data//file)",
    ],
    data = [
        "@com_github_ggerganov_ggml_mnist//file",
        "@com_github_ggerganov_ggml_mnist_data//file",
    ],
    # ...其他参数
)

2. 创建入口点模板

使用expand_template创建复杂的入口点命令：

expand_template(
    name = "entrypoint",
    data = [
        ":mnist",
        "@com_github_ggerganov_ggml_mnist//file",
        "@com_github_ggerganov_ggml_mnist_data//file",
    ],
    substitutions = {
        ":model": "$(rlocationpath @com_github_ggerganov_ggml_mnist//file)",
        ":data": "$(rlocationpath @com_github_ggerganov_ggml_mnist_data//file)",
    },
    template = [
        "./{}/mnist".format(package_name()),
        "./{}/mnist.runfiles/:model".format(package_name()),
        "./{}/mnist.runfiles/:data".format(package_name()),
    ],
)

3. 构建镜像

在镜像构建时引用模板：

oci_image(
    name = "image_",
    base = "@distroless_cc_debian12",
    entrypoint = ":entrypoint",
    tars = [":archive"],
)

高级配置选项

硬件加速支持

在构建时添加以下参数可启用特定硬件加速：

NVIDIA CUDA: --@zml//runtimes:cuda=true
AMD RoCM: --@zml//runtimes:rocm=true
Google TPU: --@zml//runtimes:tpu=true
AWS Trainium/Inferentia 2: --@zml//runtimes:neuron=true

示例命令：

bazel run //mnist:push --config=release --@zml//runtimes:cuda=true -- --repository index.docker.io/my_org/zml_mnist

最佳实践建议

使用最小化的基础镜像（如distroless）减少攻击面
为不同版本使用不同的标签
在CI/CD流水线中自动化容器构建过程
定期更新基础镜像以获取安全补丁
考虑多阶段构建以进一步优化镜像大小

总结

通过本文介绍的步骤，开发者可以轻松地将ZML项目中的模型容器化，无论是简单的模型还是需要额外数据文件的复杂模型。容器化不仅简化了部署流程，还提高了模型的可移植性和可重复性，是机器学习工程化的重要一环。

【免费下载链接】zml Any model. Any hardware. Zero compromise. Built with @ziglang / @openxla / MLIR / @bazelbuild 项目地址: https://gitcode.com/gh_mirrors/zm/zml

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考