Spark 入门

本文详细介绍了Spark的多种运行模式,包括本地模式、Standalone独立集群、StandaloneHA高可用以及Spark on Yarn。从原理到实践,逐一解析环境配置与启动步骤,并通过WordCount示例进行实战演示。此外,还探讨了Spark程序开发流程,从pom文件配置到代码编写,再到集群提交,帮助读者深入理解Spark开发。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 1. 环境搭建

1.1 本地模式(开箱即用)

1.1.1 准备工作

1.1.2 原理

1.1.3 操作

 1.1.4 WordCount 示例

 1.2 Standalone 独立集群

1.2.1 原理

 1.2.2 环境搭建与启动

1.2.3 测试

 1.3 Standalone HA

1.3.1 原理

1.3.2  集群配置与启动

 

 

1.4 Spark on Yarn

1.4.1 原理

1.4.2 准备工作

 

 1.4.3 Client 模式

 1.4.4 cluster 模式 

 1.4.5 spark-shell 和 spark-submit 区别

 可以去spark的 /bin 目录下,分别执行 ./spark-shell --help 来查看具体跟哪个参数

 2. Spark 程序开发

2.1 准备工作

2.1.1 pom文件

2.1.2 WordCount 

2.1.3 修改代码,提交到集群

2.1.4 wordcount 流程图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值