Hadoop-2.7.5 + Spark-2.2.0分布式集群搭建过程(2)

本文详细介绍了如何从启动Hadoop分布式集群到验证其正常运行,再到安装配置Scala和Spark2.2.0,最后启动Spark集群并测试,包括WordCount示例和PyCharm远程连接Spark的步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

接上篇 https://blog.youkuaiyun.com/muumian123/article/details/90201286

5.3 启动并验证Hadoop分布式集群

5.3.1 启动Hadoop分布式集群

  • 格式化hdfs文件系统:hadoop namenode -format
    在这里插入图片描述
  • 进入 sbin 中启动 hdfs:
    • ./start-dfs.sh
      在这里插入图片描述
      注意:如果出现上图中错误,需先将hdfs进行关闭再重新开启,如下图所示:
      在这里插入图片描述
      在这里插入图片描述
    • 在sparkworker1 和sparkworker2 上均启动了DataNode:
      在这里插入图片描述
      在这里插入图片描述
    • 访问 http://sparkmaster:50070/ 登录Web控制可以查看HDFS集群的状况:
      在这里插入图片描述
    • 从控制台我们可以看见有两个DataNode,此时我们点击“Live Nodes”查看一下其信息:
      在这里插入图片描述
      从控制台中看到了我们的两个Datanode 节点sparkworker1 和sparkworker2。
  • 启动 yarn 集群:./start-yarn.sh
    • 使用jps 命令可以发现 SparkMaster 机器上启动了ResourceManager 进程
      在这里插入图片描述
    • 在 sparkworker1 和sparkworker2上则分别启动了 NodeManager 进程:
      在这里插入图片描述
      在这里插入图片描述
    • 在 sparkmaster 上访问 http://sparkmaster:8088 可以通过 Web 控制台查看 ResourceManager
      运行状态:
      在这里插入图片描述
    • 在sparkmaster 上访问 http://sparkworker1:8042 可以通过 Web 控制台查看 sparkworker1 上
      的NodeManager 运行状态:
      在这里插入图片描述
    • 在sparkmaster 上访问 http://sparkworker2:8042 可以通过 Web 控制台查看 sparkworker2 上
      的 Node Manager 运行状态:
      在这里插入图片描述
    • 使用“mr-jobhistory-daemon.sh”来启动JobHistory Server: ./mr-jobhistory-daemon.sh start historyserver
      在这里插入图片描述
      启动后可以通过 http://sparkmaster:19888 在Web 控制台上看到JobHistory 中的任务执行历史信
      息:
      在这里插入图片描述
      结束historyserver 的命令为:./mr-jobhistory-daemon.sh stop historyserver
      在这里插入图片描述

5.3.2 验证Hadoop 分布式集群

  • 在 hdfs 文件系统上创建两个目录,创建过程如下所示:
hadoop fs -mkdir -p /data/wordcount
hadoop fs -mkdir -p /output

在这里插入图片描述
HDFS 中的/data/wordcount 用来存放Hadoop 自带的WordCount 例子的数据文件,程序运行的结果输出到/output/wordcount 目录中,透过Web 控制可以发现我们成功创建了两个文件夹:
在这里插入图片描述

  • 将本地文件的数据上传到HDFS 文件夹中࿱
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值