16、模型服务基础设施全解析

模型服务基础设施全解析

1. 模型加载与卸载

1.1 模型多版本原因

机器学习模型和软件类似,通常会有多个版本。创建新版本模型的频率各不相同,原因也多种多样,例如:
- 对问题有了新的见解后对模型进行改进。
- 为适应不断变化的数据或业务规则而改进模型。
- 为满足法规合规性的变化而改进模型。

随着推理服务需要支持的模型数量不断增加,每天可能会有多次模型部署。

1.2 模型加载方式

模型加载是将新模型加载到服务中以进行预测的过程,是模型部署过程的关键部分。常见的模型加载方法有以下几种:
|加载方式|描述|适用场景|优缺点|
| ---- | ---- | ---- | ---- |
|批量加载|在服务启动时一次性加载所有分配的模型。每次有模型部署时,服务需要重新部署或重启。|模型数量相对较少且不经常更改的情况。|优点:简单;缺点:每次部署需重启服务|
|按需加载|动态加载新的或更新的模型,需要某种轮询技术来确定是否有新的或更新的模型可供加载。|模型数量大或模型经常更改的情况。|优点:动态加载;缺点:需轮询技术|
|混合加载|结合了批量加载的简单性和按需加载的复杂性。|存在频繁更改和不常更改的模型混合的情况。|优点:综合两者优势;缺点:实现和维护较复杂|

1.3 模型卸载

当某个特定模型达到其生命周期的终点,需要将其驱逐时,通常会执行模型卸载操作。根据所采用的模型加载方法,相应地驱逐模型。

2. 特征提取

特征提取是模型推理过程中的重要步骤,如果设计不当,会显著增加模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值