Ray的安装部署与调试指南
1. Ray在Kubernetes上的安装
1.1 安装机制
Ray在Kubernetes上安装有两种基本机制:
- 集群启动器(Cluster launcher) :类似于使用虚拟机安装,能轻松在任何云环境部署Ray集群。它借助云提供商的SDK创建新实例或机器,执行shell命令按给定选项设置Ray并初始化集群。
- Ray Kubernetes操作符(Ray Kubernetes operator) :便于在现有Kubernetes集群部署Ray。操作符定义了名为RayCluster的自定义资源描述Ray集群的期望状态,还有自定义控制器Ray Operator处理RayCluster资源并管理Ray集群。
当同时使用集群启动器和操作符在Kubernetes集群安装Ray时,Ray利用Kubernetes功能以Kubernetes Pod形式创建新Ray节点。不过,Ray自动缩放器会从Kubernetes集群“窃取”资源,所以Kubernetes集群要么足够大以支持Ray的所有资源需求,要么提供自身的自动缩放机制。此外,由于Ray节点以Kubernetes Pod形式实现,Kubernetes资源管理器可能随时删除这些Pod以获取更多资源。
1.2 在kind集群上安装Ray
1.2.1 创建集群
使用以下命令创建一个默认配置的kind集群:
kind create cluster
超级会员免费看
订阅专栏 解锁全文
1255

被折叠的 条评论
为什么被折叠?



