Tensorflow 2.x 模型-部署与实践

本文详细介绍了TensorFlow 2.x模型的部署过程,包括ServableHandler的概念,模型保存为SavedModel格式,环境准备使用Docker镜像,Warm up模型以减少初次预测延迟,以及如何通过配置修改版本加载策略。此外,还提到了通过grpc和http接口调用服务的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

《基于TensorFlow Serving的YOLO模型部署》文章中有介绍tensorflow 1.x版本的模型如何利用TensorFlow Serving部署。本文接着上篇介绍tensorflow2.x版本的模型部署。

工作原理

架构图

**核心概念 **

**⑦ ServableHandler:**servable实例,用于处理client发送的请求

servable的生命周期:

● 一个Source插件会为一个特定的version创建一个Loader。该Loaders包含了在加载Servable时所需的任何元数据

● Source会使用一个callback来通知该Aspired Version的Manager

● 该Manager应用该配置过的Version Policy来决定下一个要采用的动作,它会被unload一个之前已经加载过的version,或者加载一个新的version

● 如果该Manager决定它是否安全,它会给Loader所需的资源,并告诉该Loader来加载新的version

● Clients会告知Manager,即可显式指定version,或者只请求最新的version。该Manager会为该Servable返回一个handle

Tensorflow 2.x 模型部署

TF serving环境准备

Tensorflow Serving环境最简单的安装方式是docker镜像安装。

docker pull tensorflow/sering:last

sudo apt-get install -y nvidia-docker2

docker pull tensorflow/serving:latest-devel-gpu

模型保存—savedmodel

Tensorflow 2.x模型有以下几种格式:

model.save_weights(“./xxx.ckpt” , save_format=”tf”)

model.save(“./xxx.h5”)
model.save_weights(“./xxx.h5”, save_format=”h5”)

model.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值