Ray:分布式计算的强大工具
1. Ray简介
Ray主要是一个用于快速且简单分布式计算的Python工具,由加州大学伯克利分校的RISELab创建。该实验室的早期版本创建了最初的软件,最终演变成了Apache Spark。RISELab的研究人员成立了Anyscale公司,以继续开发并围绕Ray提供产品和服务。此外,Ray也可以从Java使用,在底层,Ray使用了大量的C++和一些Fortran,Ray流处理也有一些Java组件。
Ray的目标是解决比其前身更广泛的问题,支持从Actor模型到机器学习(ML)再到数据并行等各种可扩展的编程模型。其远程函数和Actor模型使其成为一个真正的通用开发环境,而不仅仅局限于大数据处理。Ray能根据需要自动扩展计算资源,让你专注于代码而非服务器管理。除了传统的水平扩展(如添加更多机器),Ray还能调度任务以利用不同的机器规格和图形处理单元(GPU)等加速器。
2. Ray为无服务器计算提供的特性
自亚马逊网络服务(AWS)Lambda推出以来,无服务器计算的关注度急剧上升。在这种云计算模型中,云提供商按需分配机器资源,代表客户管理服务器。Ray为通用无服务器平台提供了强大的基础,具有以下特性:
- 隐藏服务器 :Ray的自动扩展功能根据应用程序需求透明地管理服务器。
- 支持有状态和无状态编程模型 :通过支持Actor,Ray不仅实现了大多数无服务器实现中常见的无状态编程模型,还实现了有状态的编程模型。
- 指定资源 :允许你指定执行无服务器函数所需的资源,包括硬件加速器。
超级会员免费看
订阅专栏 解锁全文
100

被折叠的 条评论
为什么被折叠?



