Hadoop分布式安装（全网最全）带注释

最新推荐文章于 2024-12-06 16:36:11 发布

原创最新推荐文章于 2024-12-06 16:36:11 发布 · 266 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#hadoop #hadoop集群

本文详细介绍了如何在三台节点上配置Hadoop集群的完全分布式模式，包括JDK环境检查、SSH免密登录配置、Hadoop解压及环境变量设置、各配置文件如core-site.xml、yarn-site.xml等的具体修改步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

大家好，今天给大家配置下hadoop集群模式，完全分布式，

配置需求 3台节点

前提：有3台干净的机器，并且安装好jdk，SSH免密登陆要配置好

话不多说，直接开干

1、安装之前首先确保你已经安装了JDK，配置好了SSH免密登陆

如果SSH没有配好的话，https://mp.youkuaiyun.com/postedit/82669131可以参考参考

2、上传解压hadoop，

修改hadoop安装目录下的 /etc/hadoop hadoop-env.sh yarn-env.sh mapred-env.sh 这3个配置文件加上java的环境变量

</configuration>

4、修改yarn-site.xml

<property>
<name>yarn.resourcemanager.hostname</name>
<value>es2</value>
</property>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

<property>
<name>yarn.resourcemanager.address</name>
<value>es2:8032</value>
</property>

<property>
<description>The address of the scheduler interface.</description>
<name>yarn.resourcemanager.scheduler.address</name>
<value>es2:8030</value>
</property>

<property>
<description>The address of the resource tracker interface.</description>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>es2:8031</value>
</property>

<property>
<name>yarn.resourcemanager.admin.address</name>
<value>es2:8033</value>
</property>

<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>es2:8088</value>
</property>

<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>

<property>
<name>yarn.log-aggregation.retain-seconds</name>
<value>604800</value>
</property>
</configuration>

<property>
<name>dfs.http.address</name>
<value>es1:50070</value>

</property>

<property>
<name>dfs.secondary.http.address</name>
<value>es1:50090</value>
</property>

<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>

<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
</configuration>