文章目录
一、配置Hadoop集群
Hadoop的配置文件都在
$HADOOP_HOME/etc/hadoop目录里
| 配置文件 | 功能描述 |
|---|---|
| hadoop-env.sh | 配置Hadoop运行所需的环境变量 |
| yarn-env.sh | 配置Yarn运行所需的环境变量 |
| core-site.xml | Hadoop核心全局配置文件,可在其他配置文件中引用 |
| hdfs-site.xml | HDFS配置文件,继承core-site.xml配置文件 |
| mapred-site.xml | MapReduce配置文件,继承core-site.xml配置文件 |
| yarn-site.xml | Yarn配置文件,继承core-site.xml配置文件 |
| workers | 配置从节点文件 |
1、在master虚拟机上配置hadoop
(1)编辑Hadoop环境配置文件 - hadoop-env.sh
-
执行命令:
cd $HADOOP_HOME/etc/hadoop,进入hadoop配置目录

-
执行命令:
vim hadoop-env.sh,添加三条环境变量配置(其实只需要添加第三条,因为前两条已经在/etc/profile里配置过了)

export JAVA_HOME=/usr/local/jdk1.8.0_231
export HADOOP_HOME=/usr/local/hadoop-3.3.4
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
-
存盘退出后,执行命令
source hadoop-env.sh,让配置生效

-
查看三个配置的三个环境变量
(2)编辑Hadoop核心配置文件 - core-site.xml
- 执行命令:
vim core-site.xml


<configuration>
<!--用来指定hdfs的老大-->
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
<!--用来指定hadoop运行时产生文件的存放目录-->
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-3.3.4/tmp</value>
</property>
</configuration>
- 由于配置了IP地址主机名映射,因此配置HDFS老大节点可用
hdfs://master:9000,否则必须用IP地址hdfs://192.168.1.101:9000

(3)编辑HDFS配置文件 - hdfs-site.xml
-
执行命令:
vim hdfs-site.xml

-
可以不用设置名称节点的目录、数据节点的目录以及辅助名称节点
配置与启动Hadoop集群实战指南

最低0.47元/天 解锁文章
7803





