基于Hadoop集群的Spark集群搭建

基于Hadoop的Spark集群搭建与程序运行

基于Hadoop集群的Spark集群搭建

一. 单机版Spark搭建

(1)将下载下来的软件包拉至集群中(主节点上)
在这里插入图片描述
(2)解压至指定目录
在这里插入图片描述
(3)将解压下的文件移至某个特定目录下并查看
在这里插入图片描述
(4)修改环境变量
在这里插入图片描述
(5)使环境变量生效并进入scala命令行测试;
在这里插入图片描述
(6)解压scala压缩包并放置指定目录;
在这里插入图片描述
(7)添加环境变量
在这里插入图片描述
(8)生效环境变量并测试spark(source .bash_profile)
在这里插入图片描述
(9)单机版网页spark测试(主机地址为你当前虚拟机地址,在启动spark的时候你可以看到)
在这里插入图片描述
二. 集群版Spark搭建

(1)修改spark配置文件(注意目录)
在这里插入图片描述
(2)修改配置文件(加入你集群的主机名)
在这里插入图片描述
(3)生成配置文件并修改配置文件(jdk为你本机安装位置)
在这里插入图片描述
在这里插入图片描述
(4)向集群中其他主机发送
在这里插入图片描述
(5)启动Hadoop集群(start-all.sh),启动spark集群(在spark目录下的sbin目录下启动)(主节点启动有Master,从节点为Worker)
在这里插入图片描述在这里插入图片描述
(6)查看端口
在这里插入图片描述
三. 访问方式
(1)添加本地映射端口localhost+8080的方式访问
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
(2)通过主节点IP地址+端口号进入Web端页面查看
在这里插入图片描述
至此,Spark集群搭建完毕。

四. 运行wordcounut程序
(1)在Hadoop集群中放置所需要的.txt文件
在这里插入图片描述
(2)执行命令spark-shell进入命令端后执行命令如下
在这里插入图片描述
至此,wordcount程序执行成功。

### 搭建基于Hadoop集群Spark框架 要在已有的Hadoop集群搭建和配置Spark框架,需要完成以下几个方面的操作: #### 1. 安装依赖项 在开始之前,确保所有的节点都已经安装了必要的软件环境。这包括Java运行环境(JRE),因为Spark是基于Scala编写的,而Scala又运行于Java虚拟机之上[^3]。 #### 2. 下载并解压Spark 访问Apache Spark官方网站获取最新版本的二进制分发包:https://spark.apache.org/downloads.html 下载完成后,在所有节点上执行如下命令来解压文件至指定目录,例如 `/opt/spark-3.x.x`: ```bash tar -zxvf spark-3.x.x-bin-hadoop3.tgz -C /opt/ ``` #### 3. 修改Spark配置文件 进入解压后的Spark目录中的 `conf` 子目录,复制模板文件并编辑它们以适配当前的Hadoop集群设置。 - **spark-env.sh**: 设置环境变量,如JAVA_HOME路径以及内存分配参数等。 ```bash export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 export SPARK_MASTER_HOST=master-node-ip ``` - **slaves**: 列出工作节点列表,每台机器IP地址占一行。 ``` worker1.example.com worker2.example.com ... ``` 另外需要注意的是,如果希望利用YARN作为资源管理器,则需进一步调整其他相关选项[^2]。 #### 4. 启动Spark服务 当一切准备就绪之后,可以启动整个集群的服务进程。对于独立模式下的Master与Worker节点分别执行以下指令即可: ```bash # Start Master node service sbin/start-master.sh # On each Worker nodes, start their services pointing to the master URL. sbin/start-slave.sh spark://<MASTER_NODE_IP>:7077 ``` 或者直接采用脚本一键开启全部组件: ```bash sbin/start-all.sh ``` #### 5. 测试验证 最后一步就是确认部署成功与否。可以通过浏览器查看Web UI界面,默认情况下Master节点监听端口为http://<master-host>:8080;同时也可以提交简单的应用程序测试连通性状况,比如WordCount例子程序。 --- ### 注意事项 除了上述基本流程外,实际生产环境中可能还会涉及到更多高级特性配置,像安全性加固(SASL/Kerberos认证机制启用),动态资源配置优化等问题都需要额外关注起来。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值