Hadoop手把手教你生态搭建及项目实战系列(五)Hadoop完全分布式集群模式整体实现

 整个系列的内容包括:

(一)环境准备

(二)Hadoop伪分布式集群模式初步实现

(三)Hadoop伪分布式集群模式整体实现

(四)Hadoop完全分布式集群模式初步实现

(五)Hadoop完全分布式集群模式整体实现

(六)HDFS Shell命令

(七)HDFS API客户端操作

(八)MapReduce案例

(九)Hadoop序列化

(十)Hadop I/O

(下面所有截图均用SecureCRT远程登录连接显示)

所需工具和环境:VMWare、三台centos虚拟机、SecureCRT(或者xshell等类似远程登录工具)


在 Hadoop 的完全分布式集群模式中,集群中的各个节点分布在多台物理机器上,实现真正的分布式计算。这种模式适用于大规模数据处理的生产环境,能够充分利用多台机器的资源,实现高效的数据存储和处理。

在完全分布式模式中,Hadoop 主要包含以下组件:

  1. HDFS(分布式文件系统):负责数据的分布式存储。NameNode 管理文件系统的元数据,多个 DataNode 分布式地存储数据块,并通过复制机制提高数据可靠性。

  2. YARN(资源调度和管理系统):负责计算资源的分配和任务管理。ResourceManager 管理集群的计算资源,NodeManager 在各节点上负责容器资源的分配和任务执行。

  3. MapReduce:用于分布式数据处理的编程模型,通过将任务拆分成多个 map 和 reduce 操作,提升大数据处理效率。

一、集群配置

集群部署规划

配置core-site.xml

cd /export/server/hadoop-3.3.0/sbin/

vim core-site.xml(将下面代码配置进core-site.xml,如果前面课程已经配置了的话可以不用再配置这一步)

<configuration>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://hadoop:8020</value>

    </property>

<!-- 设置Hadoop本地保存数据路径 -->

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/export/data/hadoop-3.3.0</value>

    </property>

</configuration>

配置hdfs-site.xml

vim hdfs-site.xml(将下面代码配置进hdfs-site.xml,指定secondary namenode)

将之前的配置

重新改为

<property>

    <name>dfs.namenode.secondary.http-address</name>

    <value>hadoop2:9868</value>

 </property>

配置yarn-site.xml

vim yarn-site.xml(将下面代码配置进yarn-site.xml,学生如果前面课程已经配置了的话可以不用再配置这一步)

<property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>
</property>

<property>

        <name>yarn.resourcemanager.hostname</name>

        <value>hadoop</value>

</property>

配置mapred-site.xml

vim mapred-site.xml(将下面代码配置进mapred -site.xml,学生如果前面课程已经配置了的话可以不用再配置这一步)

<!-- 设置MR程序默认运行模式:yarn集群模式 local本地模式 -->  

  <property>

      <name>mapreduce.framework.name</name>

      <value>yarn</value>

    </property>

配置workers

将workers里面的内容改为

hadoop

hadoop2

hadoop3

在集群上分发配置好的Hadoop配置文件

第一种方法:

scp -r /export/server/  root@hadoop2:/export/

scp -r /export/server/  root@hadoop3:/export/

第二种方法:

利用实战系列(四)中的xsync脚本进行分发

xsync hadoop/

至此Hadoop完全分布式集群模式搭建完成,接下来我们会在这个集群进行后续操作和教学!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

_bukesiyi

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值