5、深度学习系统：模型部署、服务更新与现有解决方案综述

bean

于 2025-08-18 16:28:47 发布

阅读量43

点赞数

CC 4.0 BY-SA版权

分类专栏：构建深度学习系统文章标签：深度学习系统模型部署服务更新

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/bean/article/details/151034516

构建深度学习系统专栏收录该内容

18 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

深度学习系统：模型部署、服务更新与现有解决方案综述

1. 模型推理服务示例

在一个示例设置中，模型推理服务加载了版本 1.0 和版本 2.0 的模型，随时准备处理推理请求。从元数据与工件存储中读取到 9:1 的流量分配配置，这意味着在进行推理时，模型推理服务会将约 90% 的传入推理请求流量导向模型版本 1.0，其余 10% 导向版本 2.0，这一过程对服务客户端是透明的。同时，模型推理服务会收集客户端反馈、指标和日志，供研究人员和数据科学家比较新旧模型。

2. 服务更新方法

2.1 排空（DRAINING）

当服务设计为支持排空时，它必须等待子进程完成后再关闭自身，同时不再接受会产生新子进程的新请求。这个排空过程可能比典型的 Web 服务更长，因为后者的会话生命周期通常较短。此外，还需要一个组件来同时前置服务的新旧版本，确保新请求只发送到新版本。

服务与其子进程之间的握手设计也值得注意。如果子进程主动与父服务通信（例如发送进度信息），服务端可能需要进行适当的排空。不过，也有一些技术可以容忍缺乏排空的情况。

2.2 交接（HANDING OFF）

我们可以设计服务将监督和监控职责交接给新版本，而不是依赖排空。交接的设计方式各不相同，主要取决于监督服务与子进程之间的监督和握手方式。以下是一些示例：
- 服务的状态信息可以由持久数据存储支持，但这可能会使数据架构设计复杂化，因为服务的新旧版本可能会在短时间内同时访问数据存储。
- 如果子进程主动与监督者通信，可以通过使用负载均衡器等基础设施组件前置监督者，使监督者的 URL 在不同版本间保持不变。为了实现平稳过渡，可能需要额

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。