5、深度学习系统:模型部署、服务更新与现有解决方案综述

深度学习系统:模型部署、服务更新与现有解决方案综述

1. 模型推理服务示例

在一个示例设置中,模型推理服务加载了版本 1.0 和版本 2.0 的模型,随时准备处理推理请求。从元数据与工件存储中读取到 9:1 的流量分配配置,这意味着在进行推理时,模型推理服务会将约 90% 的传入推理请求流量导向模型版本 1.0,其余 10% 导向版本 2.0,这一过程对服务客户端是透明的。同时,模型推理服务会收集客户端反馈、指标和日志,供研究人员和数据科学家比较新旧模型。

2. 服务更新方法

2.1 排空(DRAINING)

当服务设计为支持排空时,它必须等待子进程完成后再关闭自身,同时不再接受会产生新子进程的新请求。这个排空过程可能比典型的 Web 服务更长,因为后者的会话生命周期通常较短。此外,还需要一个组件来同时前置服务的新旧版本,确保新请求只发送到新版本。

服务与其子进程之间的握手设计也值得注意。如果子进程主动与父服务通信(例如发送进度信息),服务端可能需要进行适当的排空。不过,也有一些技术可以容忍缺乏排空的情况。

2.2 交接(HANDING OFF)

我们可以设计服务将监督和监控职责交接给新版本,而不是依赖排空。交接的设计方式各不相同,主要取决于监督服务与子进程之间的监督和握手方式。以下是一些示例:
- 服务的状态信息可以由持久数据存储支持,但这可能会使数据架构设计复杂化,因为服务的新旧版本可能会在短时间内同时访问数据存储。
- 如果子进程主动与监督者通信,可以通过使用负载均衡器等基础设施组件前置监督者,使监督者的 URL 在不同版本间保持不变。为了实现平稳过渡,可能需要额

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值