21、模型服务：从创建到部署的全面指南

最新推荐文章于 2025-12-03 18:58:14 发布

nice1

最新推荐文章于 2025-12-03 18:58:14 发布

阅读量26

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习的可靠性革命文章标签：模型服务机器学习预测延迟

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/nice1/article/details/152409110

机器学习的可靠性革命专栏收录该内容

40 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

模型服务：从创建到部署的全面指南

1. 模型服务概述

在创建好一个模型后，需要将其投入实际应用以进行预测，这个过程通常被称为“模型服务”。它指的是创建一个结构，确保系统能够让模型对新示例进行预测，并将这些预测结果返回给需要的人员或系统。

以 yarnit.ai 在线商店为例，团队创建了一个能出色预测用户购买特定产品可能性的模型。但如何将模型的预测结果与整个系统集成呢？有多种可能性，每种都有不同的架构和权衡：
1. 将模型加载到美国爱荷华州得梅因市的 1000 台服务器中，并将所有传入流量导向这些服务器。
2. 使用大型离线批处理作业，预先计算最常见的 1 亿种纱线产品和用户查询组合的模型预测结果。每天将这些结果写入共享数据库，供系统读取，对于不在列表中的内容，使用默认分数 p = 0.01。
3. 创建模型的 JavaScript 版本，并将其加载到网页中，以便在用户浏览器中进行预测。
4. 创建一个嵌入模型的移动应用程序，使预测在用户的移动设备上进行。
5. 拥有不同版本的模型，在计算成本和准确性之间进行不同的权衡。创建一个分层系统，在云中提供不同版本的模型，使用不同成本的硬件。将简单的查询发送到较便宜（准确性较低）的模型，将较困难的查询发送到较昂贵（准确性较高）的模型。

2. 模型服务的关键问题

2.1 模型的负载情况

模型服务环境中的首要问题是模型需要处理的流量水平，即每秒查询数（QPS）。不同的应用场景对 QPS 的要求差异很大：
- 为数百万日常用户提供预测的模型，可能每秒需要处理数万个查询。
- 运行音频识别器以监听移动设备上“唤醒词”（如“Hey Y

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。