Spark安装

最新推荐文章于 2025-05-06 17:01:20 发布

原创最新推荐文章于 2025-05-06 17:01:20 发布 · 302 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#spark #big data #scala

大数据专栏收录该内容

8 篇文章

订阅专栏

本文详细介绍Spark3的安装步骤，包括环境准备、配置修改及启动验证等关键环节，并提供集群搭建的具体实践。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

参考	Spark3的详细安装步骤_Mercury_春秋的博客-优快云博客_spark3 安装

下载	Index of /apache/spark 要根据字节的hadoop版本来选择因为我这里使用的是3.3的hadoop，所以用新一点的spark版本吧。注：scala是一门计算机语言，基于java虚拟机环境运行的。我这里暂时不需要了解。所以下载287M的那个就好。
提前准备	集群机器相互同步时间 -- 设备是联网的，时间没问题机器之间实现免密登录 -- 在安装hadoop时，已经设置了主节点免密登录其他从节点，OK 所有机器都关闭防火墙 -- OK 所有机器都需要安装JDK1.8 -- OK Hadoop环境最好是在3.2 -- 目前是3.3
开始操作	在主节点机器操作即可，后面会通过拷贝命令把数据发送到从节点机。
解压和重命名	tar -zxvf spark-3.2.1-bin-hadoop3.2.tgz 重命名是把原文件路径名改短一点，这样方便配置东西 mv spark-3.2.1-bin-hadoop3.2 spark
配置	cd spark/conf/ 环境配置复制配置样例 cp spark-env.sh.template spark-env.sh 查看字节的java安装在哪里了： root@pc1-node1:/usr/data2/program/spark/spark/conf# echo $JAVA_HOME /usr/local/java/jdk8 修改环境配置 vi spark-env.sh export JAVA_HOME=/usr/local/java/jdk8 集群配置 cp workers.template workers vi workers 同hadoop的配置，我这里集群为6个设备1主5从 pc1-node2 pc1-node3 pc2-node1 pc2-node2 pc2-node3 拷贝spark应用文件、spark配置等信息到从节点机器回到spark根目录注，我这里spark用了两层看到两个spark/spark这样的结构第一层spark我是用来存储一些其他文件的。第二层spark是应用文件路径。你自己按需操作即可。执行拷贝命令： scp -rq ./spark/ pc1-node2:$PWD/spark/ scp -rq ./spark/ pc1-node3:$PWD/spark/ scp -rq ./spark/ pc2-node1:$PWD/spark/ scp -rq ./spark/ pc2-node2:$PWD/spark/ scp -rq ./spark/ pc2-node3:$PWD/spark/ -r是递归复制整个目录 -q是不显示复制过程详细文件列表如果显示没有创建目录，先自己处理一下
添加环境变量	所有设备都要添加 vi /etc/profile 在文件后追加spark环境 #spark environment export SPARK_HOME=/usr/data2/program/spark/spark export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin 所有设备都要重新加载环境变量 source /etc/profile
修改web ui端口	修改主节点webui端口 cd ../sbin/ 编辑主节点的start-master.sh SPARK_MASTER_WEBUI_PORT=8077 默认为8080 为了避免与其他应用重复，我修改为8077
启动	在主节点启动： cd ./spark/sbin/ ./start-all.sh 有一个机器配置路径有问题，先停止所有集群，检查，修改后，重新启动。停止命令： ./stop-all.sh 重新启动设备信息对了就OK
访问界面	spark提供了webU界面 http://192.168.0.11:8077 注：默认为8080，我修改为8077 其他端口如需修改参考：https://www.cnblogs.com/strolling-leisurely/p/14443644.html> spark master：默认是8080 修改方式：在sbin目录下编辑start-master.sh文件，修改SPARK_MASTER_WEBUI_PORT=8080 spark worker：默认是8081 修改方式：在sbin目录下编辑start-slave.sh文件，修改SPARK_MASTER_WEBUI_PORT=8081 Spark当前执行的任务页面:默认是4040 修改方式：在conf目录下编辑spark-defaults.sh文件，添加一条配置：spark.ui.port 4040
服务启动验证	在主节点机 bin目录执行： ./run-example SparkPi 5 --master local[1] 看到如下：说明服务正常

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。