Spark从入门到精通第七课:Spark运行模式概述 && Spark standalone模式精讲 && spark核心概念

本文介绍了Spark的运行模式,深入讲解了sparkStandalone模式,特别是通过spark-client的执行流程进行阐述,同时探讨了Spark的核心概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 1、Spark运行模式概述

1、spark的运行模式
    local
    yarn-client            yarn-cluster
    standalone-client      standalone-cluster
    k8s/mesos(不讲)

2、local模式:
在Linux上的local:
     将spark安装包解压
        JAVA_HOME ====> spark_env.sh
        SPARK_HOME ===>/etc/profile
      启动:
            spark-shell --master local[n] 
            ####n代表该作业所需要消耗的core的数量

在IDE开发工具中的local:
    在IDEA中新建maven项目
    在pom.xml中配置spark依赖
    书写spark程序可以直接运行


3、spark on yarn概述
    有两种模式:yarn-client  &&  yarn-cluster
    在这两种模式下,spark都只是作为提交作业的客户端,不会起任何spark的进程。
    ./spark-shell --master yarn --jars mysql驱动包绝对路径
    
spark的jars目录:
    在saprk1.x中该目录下只有一个大的包,所有jar包都在这个包里面。
    在spark2.x该jars目录下就有很多的小的jar包。这儿有一个spark的优化点,以后再说。
        
spark on yarn生产用得最多,在下一篇博客中会详细讲解


4、spark日志级别
conf目录下执行命令:
    cp  log4j.properties.template   log4j.properties    && vi log4j.properties
    将“log4j.ro
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

二百四十九先森

你的打赏是我努力的最大动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值