Hadoop3.1.3 完全分布式配置

最新推荐文章于 2023-02-21 10:09:03 发布

程序员驴子酱

最新推荐文章于 2023-02-21 10:09:03 发布

阅读量930

点赞数 3

分类专栏：大数据

本文链接：https://blog.youkuaiyun.com/shkstart/article/details/109313567

版权

大数据专栏收录该内容

18 篇文章

订阅专栏

本文详细介绍了Hadoop集群的核心配置过程，包括Hadoop环境变量设置、核心配置文件core-site.xml和hdfs-site.xml的参数调整，以及YARN和MapReduce组件的具体配置方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

（1）配置：hadoop-env.sh

Linux系统中获取JDK的安装路径：

[atguigu@ hadoop101 ~]# echo $JAVA_HOME
/opt/module/jdk1.8.0_212

在hadoop-env.sh文件中修改JAVA_HOME 路径：

export JAVA_HOME=/opt/module/jdk1.8.0_212

（2）核心配置文件

（a）配置core-site.xml

cd $HADOOP_HOME/etc/hadoop
vim core-site.xml

文件内容如下：

    <!-- 指定NameNode的地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop102:8020</value>
    </property>
    <!-- 指定hadoop数据的存储目录  
      官方配置文件中的配置项是hadoop.tmp.dir ,用来指定hadoop数据的存储目录,此次配置用的hadoop.data.dir是自己定义的变量， 因为在hdfs-site.xml中会使用此配置的值来具体指定namenode 和 datanode存储数据的目录-->
    <property>
        <name>hadoop.data.dir</name>
        <value>/opt/module/hadoop-3.1.3/data</value>
    </property>

（3）HDFS配置文件

（a）配置hdfs-site.xml

vim hdfs-site.xml

文件内容如下：

<!-- 指定副本数  -->
<property>
  <name>dfs.replication</name>
  <value>3</value>
</property>

<!-- 指定NameNode数据的存储目录 -->
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>file://${hadoop.data.dir}/name</value>
  </property>
 <!-- 指定Datanode数据的存储目录 -->

  <property>
    <name>dfs.datanode.data.dir</name>
    <value>file://${hadoop.data.dir}/data</value>
  </property>
    
   <!-- 指定SecondaryNameNode数据的存储目录 -->

    <property>
    <name>dfs.namenode.checkpoint.dir</name>
    <value>file://${hadoop.data.dir}/namesecondary</value>
  </property>
   
   <!-- 兼容配置，先跳过 -->
    <property>
    <name>dfs.client.datanode-restart.timeout</name>
    <value>30s</value>
  </property>

  <!-- nn web端访问地址-->
<property>
  <name>dfs.namenode.http-address</name>
  <value>hadoop102:9870</value>
</property>
  <!-- 2nn web端访问地址-->

  <property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>hadoop104:9868</value>
</property>

（4）YARN配置文件

（a）配置yarn-site.xml

vim yarn-site.xml

文件内容如下：

<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
</property>
 <!-- 指定ResourceManager的地址-->
<property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop103</value>
</property>
<!-- 环境变量的继承 -->
<property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
</property>
<!--  取消虚拟内存的限制 -->
<property>
<name>yarn.nodemanager.vmem-check-enabled</name>
<value>false</value>
</property>

（5）MapReduce配置文件

配置mapred-site.xml

vim mapred-site.xml

文件内容如下：

<!-- 指定MapReduce程序运行在Yarn上 -->
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>

Hadoop3.1.3 完全分布式配置

（1）配置：hadoop-env.sh

（2）核心配置文件

（a）配置core-site.xml

（3）HDFS配置文件

（a）配置hdfs-site.xml

（4）YARN配置文件

（a）配置yarn-site.xml

（5）MapReduce配置文件

（6）同步配置文件到其它节点