Ray项目Java应用服务化部署实战指南-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00302/article/details/148360129

Ray项目Java应用服务化部署实战指南

ray ray-project/ray: 是一个分布式计算框架，它没有使用数据库。适合用于大规模数据处理和机器学习任务的开发和实现，特别是对于需要使用分布式计算框架的场景。特点是分布式计算框架、无数据库。项目地址: https://gitcode.com/gh_mirrors/ra/ray

前言

在分布式计算领域，Ray项目作为一个新兴的分布式计算框架，为开发者提供了简单高效的分布式编程能力。本文将重点介绍如何使用Ray Serve模块将Java应用服务化部署，实现计算任务的分布式执行。

环境准备

要使用Java版Ray Serve，需要在项目中添加以下Maven依赖：

<dependency>
  <groupId>io.ray</groupId>
  <artifactId>ray-serve</artifactId>
  <version>${ray.version}</version>
  <scope>provided</scope>
</dependency>

注意：provided作用域确保在集群部署时不会产生版本冲突问题，因为Ray Serve的Java包已经包含在Ray的Python安装环境中。

业务场景分析

我们以一个金融应用的生产工作流为例，该应用需要计算与不同银行交互的最佳策略。核心业务逻辑包含三层嵌套循环：

外层循环遍历所有银行
中层循环遍历每家银行的所有指标
内层循环计算具体指标

这种结构在数据量增大时会导致严重的性能问题，即使使用线程池也会遇到单机性能瓶颈。

传统实现方式

传统实现采用Strategy类进行计算，核心代码如下：

public class Strategy {
    // 计算入口方法
    public Map<String, Map<String, Double>> calc(long time, Map<String, List<String>> banks) {
        // 两层循环结构
        for (String bank : banks.keySet()) {
            for (String indicator : banks.get(bank)) {
                calcIndicator(bank, time, indicator);
            }
        }
    }
    
    // 具体指标计算方法
    private double calcIndicator(String bank, long time, String indicator) {
        // 业务计算逻辑
    }
}

这种实现方式存在明显的扩展性问题，无法应对大规模计算需求。

Ray Serve服务化改造

通过Ray Serve，我们可以将核心计算逻辑改造为可扩展的分布式服务。

1. 重构业务逻辑

首先将每家机构的指标计算提取为独立的StrategyOnRayServe类：

public class StrategyOnRayServe {
    // 单指标计算方法
    public Double calcIndicator(String bank, long time, String indicator) {
        // 业务计算逻辑
    }
}

2. 部署服务

启动Ray Serve运行时并将服务部署为可扩展的分布式服务：

public class StrategyCalcOnRayServe {
    public static void main(String[] args) {
        // 初始化Ray
        Ray.init();
        
        // 创建部署配置
        DeploymentConfig config = new DeploymentConfig()
            .setNumReplicas(4);
        
        // 创建并部署服务
        Deployment.create("strategy", config, StrategyOnRayServe::new)
            .deploy();
    }
}

这段代码创建了一个名为"strategy"的服务，并部署了4个副本，可实现分布式并行计算。

服务调用方式

1. 直接调用

可以通过RayServeHandle在Ray集群内直接调用服务：

RayServeHandle handle = Deployment.getHandle("strategy");
Double result = handle.method("calcIndicator")
    .remote("bank1", 1641038674L, "indicator1")
    .get();

2. 并行调用

利用Ray的并行计算能力，可以显著提高计算效率：

List<ObjectRef<Double>> resultRefs = new ArrayList<>();
for (String bank : banks.keySet()) {
    for (String indicator : banks.get(bank)) {
        resultRefs.add(handle.method("calcIndicator")
            .remote(bank, time, indicator));
    }
}
List<Double> results = Ray.get(resultRefs);

HTTP接口调用

Ray Serve还支持通过HTTP访问服务，但需要注意以下限制：

只有用户类的call方法能处理HTTP请求
输入输出只能是String类型

1. HTTP服务改造

public class HttpStrategyOnRayServe {
    public String call(String request) {
        // 解析JSON请求
        JSONObject json = new JSONObject(request);
        long time = json.getLong("time");
        String bank = json.getString("bank");
        String indicator = json.getString("indicator");
        
        // 执行业务逻辑
        double result = calcIndicator(bank, time, indicator);
        
        // 返回JSON结果
        return new JSONObject().put("result", result).toString();
    }
}

2. HTTP客户端调用

部署后可通过curl或HTTP客户端访问：

String response = Request.post("http://127.0.0.1:8000/strategy")
    .bodyString(
        new JSONObject()
            .put("time", 1641038674L)
            .put("bank", "test_bank")
            .put("indicator", "test_indicator")
            .toString(),
        ContentType.APPLICATION_JSON
    )
    .execute()
    .returnContent()
    .asString();