Ray在企业中的应用与实践
1. 临时集群与永久集群对比
在Ray的使用中,临时集群(Transient/ephemeral clusters)和永久集群(Permanent clusters)各有特点,以下是它们的详细对比:
| 对比项 | 临时集群 | 永久集群 |
| — | — | — |
| 资源成本 | 通常较低,除非运行时工作负载可以进行装箱或在用户之间共享资源 | 当资源泄漏阻止自动缩放器缩小时成本较高 |
| 库隔离 | 灵活(包括原生) | 仅支持venv/Conda环境级别的隔离 |
| 尝试Ray新版本的能力 | 可以,但可能需要为新API更改代码 | 开销较高 |
| 最长参与者生命周期 | 短暂(与集群一起) | “永久”(不包括集群崩溃/重新部署) |
| 共享参与者 | 否 | 是 |
| 启动新应用的时间 | 可能较长(取决于云服务) | 不同情况不同(如果集群有几乎即时的空闲容量则较快;否则取决于云服务) |
| 数据读取摊销 | 否(每个集群必须读取任何共享数据集) | 可能(如果结构良好) |
选择临时集群还是永久集群取决于具体的用例和需求。在某些部署中,临时集群和永久集群的混合使用可能会提供合适的权衡。
2. Ray监控
随着组织中Ray集群规模或数量的增长,监控变得越来越重要。Ray通过其内部仪表板或Prometheus提供了内置的指标报告,不过Prometheus默认是禁用的。
- 内部仪表板 :安装 ray [default] 时会安装Ray的
超级会员免费看
订阅专栏 解锁全文
950

被折叠的 条评论
为什么被折叠?



