SparkSubmit.main()方法提交外部参数,远程提交standalone集群任务

博客介绍了将Java代码提交任务到Spark Standalone的相关内容。包含官方文档描述,引入相关依赖时需注意版本问题,给出了具体的pom依赖代码。还展示了Java代码示例,最后提到运行结果,可通过ps.free -m查看内存使用率,内存不足任务会等待。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、官方文档描述

二、引入pom【注意版本问题】

 <dependency>  
         <groupId>org.apache.spark</groupId>  
         <artifactId>spark-core_2.11</artifactId>  
         <version>2.2.0</version>  
     </dependency>  
  
     <dependency>  
         <groupId>org.apache.hadoop</groupId>  
         <artifactId>hadoop-client</artifactId>  
         <version>2.2.0</version>  
     </dependency>  

三、代码


import java.io.IOException;

import org.apache.spark.deploy.SparkSubmit;

public class Main {
    public static void main(String[] args) throws IOException {
        String appName = "test java web submit job to spark standalone";
        String className="cfca.xfraud.mltrain.DataTrainning";
        String [] arg0=new String[]{
                "--master","spark://192.168.115.64:7077",//ip端口
                 "--deploy-mode","cluster",
                 "--name",appName,
                 "--class",className,//运行主类main
                 "--executor-memory","2G",
                 "--total-executor-cores","10",
                 "--executor-cores","2",
                 "/home/xfraud/ml_train/MachineLearningTraining-0.2.jar",//在linux上的包 可改为hdfs上面的路径
                 "LR", "20180817111111", "66"//jar中的参数,注意这里的参数写法
        };
        SparkSubmit.main(arg0);
    }
}

四、运行结果

ps.free -m  查看机子上的内存使用率 ,注意内存不足的时候,spark界面上的任务会陷入等待。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值