spark集群使用相关

明天,今天,此时

已于 2022-03-31 22:12:10 修改

阅读量1.7k

点赞数

文章标签： spark spark使用 spark客户端

于 2022-03-31 22:11:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/LearnToPain/article/details/123884955

版权

本文详细介绍了Spark Standalone集群和Spark on YARN的部署步骤，包括所需组件、配置及测试方法。重点讲解了如何使用spark-submit提交任务，并提供了官方文档链接以供参考。此外，还提到了Spark高可用性的设置建议。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

spark standalone集群部署

只需ssh+jdk+spark-with-hadoop+[zookeeper(HA)]

spark on yarn集群部署

需要ssh+jdk+hadoop+yarn+spark+[zookeeper(HA)]
spark-shell --master yarn

查看集群情况

http://:4040/
http://:8080/

集群内测试：

bin/spark-submit --class org.apache.spark.examples.JavaSparkPi --master spark://cdh1:7077 examples/jars/spark-examples_2.11-2.4.0.jar 2
run-example SparkPi 10
val textFile = spark.read.textFile(“file:///root/abc”) #spark读取本地文件每个节点同样路径都要有数据文件，HDFS可以共享，有一份就可以了
textFile.count()
val nums = sc.parallelize(List(1,2,3,4,5))
nums.count()

集群外客户端测试

bin/spark-submit
–class org.apache.spark.examples.JavaSparkPi
–master spark://cdh1:7077
–total-executor-cores 2
–num-executors 1
–driver-memory 512m
–executor-memory 512m
–executor-cores 1
examples/jars/spark-examples_2.11-2.4.0.jar 2
或者
bin/spark-submit --class org.apache.spark.examples.JavaSparkPi --master spark://cdh1:7077 --driver-memory 512m --executor-memory 512m --total-executor-cores 2 --executor-cores 1 examples/jars/spark-examples_2.11-2.4.0.jar 2
或者
bin/spark-submit --class org.apache.spark.examples.JavaSparkPi --master spark://cdh1:7077 examples/jars/spark-examples_2.11-2.4.0.jar 2
#注意，要先在客户集群中每个节点的hosts添加客户机的ip-主机名

官方方法

http://spark.incubator.apache.org/docs/2.4.0/quick-start.html

官方部署说明

http://spark.incubator.apache.org/docs/2.4.0/spark-standalone.html#installing-spark-standalone-to-a-cluster

spark高可用参考

https://www.cnblogs.com/phy2020/p/12723547.html

明天,今天,此时

博客等级

码龄6年

107
原创

92
点赞

220
收藏

27
粉丝

关注

私信

热门文章

分类专栏

安装 26篇
代码 14篇
笔记 9篇
数据结构 3篇
Dijkstra 1篇
算法 27篇
others 24篇

展开全部收起

最新评论

HIVE4.0.0的10000端口启动不起来的一种情况
MuZhi_xuan: 是不是hiveserver2启动后没有10000监听导致最新版本的b什么进不去，然后这样解决的，我已经困了三天了明天试试，希望可行
Hive的map/struct/array怎么通过insert插入数据
穷苦书生_万事愁: 这篇文章让我对Hive中map/struct/array数据类型如何通过insert插入数据有了全新的了解。博主的细节描述非常到位，让我感受到了他的专业功底。我期待着博主未来能够持续分享更多这样有价值的文章，同时也希望能够得到他的指导，一起共同进步。真心感谢博主的分享和支持！
怎么解决C语言switch case getchar()或者scanf()无法正常运行？
Tawanna-233: 我加getchar他还是不行
怎么解决C语言switch case getchar()或者scanf()无法正常运行？
焚詩作薪: 漂亮，解决了我的大问题
补码有什么用？
做而论道_CS: 补码的长处，是计算机做加减运算。乘除时，应该用绝对值相乘除、符号位相异或。这是最简便的方法。而且，乘除法的硬件，也可以适用于无符号数的乘除。如果用补码来做乘除，麻烦不说，也不好用无符号数通用。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。