Spark(单节点)环境配置

// 通过wget下载zookeeper安装包
[bigdata@linux ~]$ wget https://d3kbcqa49mib13.cloudfront.net/spark-2.1.1-bin-hadoop2.7.tgz 
// 将spark解压到安装目录
[bigdata@linux ~]$ tar –xf spark-2.1.1-bin-hadoop2.7.tgz –C ./cluster
// 进入spark安装目录
[bigdata@linux cluster]$ cd spark-2.1.1-bin-hadoop2.7/
// 复制slave配置文件
[bigdata@linux spark-2.1.1-bin-hadoop2.7]$ cp ./conf/slaves.template ./conf/slaves    
// 修改slave配置文件
[bigdata@linux spark-2.1.1-bin-hadoop2.7]$ vim ./conf/slaves
linux  #在文件最后将本机主机名进行添加
// 复制Spark-Env配置文件
[bigdata@linux spark-2.1.1-bin-hadoop2.7]$ cp ./conf/spark-env.sh.template ./conf/spark-env.sh 
SPARK_MASTER_HOST=linux       #添加spark master的主机名
SPARK_MASTER_PORT=7077        #添加spark master的端口号

安装完成之后,启动Spark 

// 启动Spark集群
[bigdata@linux spark-2.1.1-bin-hadoop2.7]$ sbin/start-all.sh
// 访问Spark集群,浏览器访问http://linux:8080
 

 

 

// 关闭Spark集群
[bigdata@linux spark-2.1.1-bin-hadoop2.7]$ sbin/stop-all.sh

 

### 在虚拟机中配置和安装Spark单节点集群 #### 1. 安装和解压Spark 在虚拟机中安装Spark单节点环境的第一步是下载并解压Spark的二进制文件。假设你已经下载了Spark的压缩包,可以使用以下命令将其解压到指定目录: ```bash tar -zxvf spark-3.2.1-bin-hadoop2.7.tgz -C /usr/local/ ``` 随后,进入解压后的目录,并设置软链接以便于管理: ```bash ln -s /usr/local/spark-3.2.1-bin-hadoop2.7 /usr/local/spark ``` #### 2. 修改配置文件 进入Spark的`conf`目录后,需要复制模板文件以生成实际使用的配置文件[^1]: ```bash cd /usr/local/spark/conf cp spark-env.sh.template spark-env.sh ``` 编辑`spark-env.sh`文件,添加必要的环境变量,例如Java路径和内存分配: ```bash export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64 export SPARK_MASTER_HOST=localhost ``` #### 3. 检查Hadoop与Spark的依赖冲突 如果系统中同时安装了Hadoop和Spark,可能会出现依赖库版本冲突的问题。具体来说,检查Hadoop安装目录下的`/share/hadoop/common/lib/`中的`guava.jar`包版本,以及Spark安装目录下的`/jars/`中的`guava.jar`包版本。将两者中较高版本的`guava.jar`覆盖较低版本的文件[^2]。 #### 4. 启动Spark本地模式 完成上述配置后,可以通过以下命令启动Spark的本地模式: ```bash cd /usr/local/spark/bin ./spark-shell ``` 这将启动Spark的交互式Shell环境,用于测试和调试。 #### 5. 测试Spark运行 为了验证Spark是否正确安装并运行,可以使用内置的`SparkPi`示例程序计算π值[^3]: ```bash ./run-example SparkPi 2 ``` 此命令将在控制台输出计算结果,表明Spark单节点环境已成功部署。 ### 注意事项 确保虚拟机中的Java环境已正确配置,推荐使用OpenJDK 8或11。此外,检查网络设置,确保虚拟机能够访问互联网以下载必要的依赖项。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值