10、利用Ray Serve实现微服务与模型服务

最新推荐文章于 2025-10-03 12:54:06 发布

cuda7parallel

最新推荐文章于 2025-10-03 12:54:06 发布

阅读量53

点赞数

CC 4.0 BY-SA版权

分类专栏：用Ray解锁Python新维度文章标签： Ray Serve 微服务模型服务

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/cuda7parallel/article/details/151308035

用Ray解锁Python新维度专栏收录该内容

20 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

利用Ray Serve实现微服务与模型服务

1. Ray Serve简介

Ray最初是为实现强化学习而创建的框架，后来逐渐演变成一个成熟的无服务器平台。Ray Serve最初是作为更好地服务机器学习模型的方式引入的，如今已发展成为一个成熟的微服务框架。接下来将介绍如何使用Ray Serve实现通用微服务框架以及如何使用该框架进行模型服务。

2. Ray微服务架构理解

Ray微服务架构（Ray Serve）基于Ray的actor实现，一个Serve实例由三种actor组成：
- Controller ：每个Serve实例独有的全局actor，负责管理控制平面，负责创建、更新和销毁其他actor。所有Serve API调用（如创建或获取部署）都通过它执行。
- Router ：每个节点有一个路由器，是一个Uvicorn HTTP服务器，接受传入请求，将其转发给副本，并在处理完成后响应。
- Worker replica ：工作副本根据请求执行用户定义的代码，每个副本处理来自路由器的单个请求。

用户定义的代码通过Ray部署实现，它是Ray actor的扩展，具有额外功能。下面从部署本身开始介绍。

3. 部署基础

3.1 部署概念

部署是Ray Serve的核心概念，它定义了处理传入请求的业务逻辑以及该逻辑通过HTTP或Python暴露的方式。以一个实现温度控制器的简单部署为例：

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。