spark分布式环境搭建(1) 单个系统环境准备

最新推荐文章于 2025-06-09 23:19:06 发布

原创最新推荐文章于 2025-06-09 23:19:06 发布 · 228 阅读

CC 4.0 BY-SA版权

文章标签：

19 篇文章

订阅专栏

本文详细介绍了如何在单个系统上准备Spark分布式环境，包括关闭防火墙、禁用seLinux、安装并配置Java与Scala环境变量等步骤。适用于虚拟机或实体服务器环境，为集群测试与组件性能评估提供基础。

因为测试新的组件性能，需要个集群，没有多余的机器，所以自己搭建一个环境，之前搭建的系统都删除了。所以重新记录一下，以防下次再搭建的时候，反复去搜索文档。

注明：我这里用的是vmware搭建的环境，如果是实体服务器玩家，稍作修改

准备一个linux系统(我这里是cent os 7)

本文主要包括以下内容:

关闭防火墙

systemctl status firewalld

systemctl stop firewalld

systemctl disable firewalld

systemctl enable firewalld

修改hostname

vim /etc/hostname
#修改成自己想要的名字

java环境变量

mkdir -p /opt/java
tar -zxvf jdk-8u241-linux-x64.tar.gz
mv jdk1.8.0_241/ jdk1.8

vim /etc/profile
# 添加如下
export JAVA_HOME=/opt/java/jdk1.8
export PATH=$PATH:$JAVA_HOME/bin
# 修改完毕，退出修改
source /etc/profile

scala环境变量安装

tar -zxvf scala-2.12.7.tgz
vim /etc/profile
## 在下面添加
export SCALA_HOME=/opt/scala
export PATH=$PATH:$SCALA_HOME/bin

最后上传一下以下三个安装包

hadoop     版本 2.7
zookeeper  版本 3.5
spark      版本 3.0 with hadoop 2.7