hadoop环境配置

最新推荐文章于 2020-07-03 03:26:01 发布

原创最新推荐文章于 2020-07-03 03:26:01 发布

· 238 阅读

0 ·

版权

文章标签：

#hadoop #大数据

计算机同时被 3 个专栏收录

22 篇文章

订阅专栏

大数据

8 篇文章

订阅专栏

hadoop

6 篇文章

订阅专栏

本文详细介绍Hadoop集群的配置过程，包括环境变量设置、核心配置文件调整如hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml及yarn-site.xml的参数修改，以及网络配置和防火墙关闭等关键步骤。最后，通过格式化和启动脚本确保Hadoop集群正确运行。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、在hadoop安装目录下/etc/Hadoop下：

hadoop-env.sh配置
vi hadoop-env.sh

修改配置export JAVA_HOME=/home/liujie/JDK/jdk1.8.0_131

core-site.xml配置
vi core-site.xml

<property>

    <name>fs.defaultFS</name>

    <value>hdfs://rack1:9000/</value>

 </property>

<property>

     <name>hadoop.tmp.dir</name>

     <value>/home/liujie/hadoop/hadoop-2.7.7/tmp</value>

</property>

hdfs-site.xml配置
vi hdfs-site.xml

<property>

    <name>dfs.replication</name>

    <value>1</value>

<!-- 1指的是分布副本也可以定义切块的大小，默认是128M  -->
</property>

mapred-site配置
mv mapred-site.xml.template mapred-site.xml #必须先改名

 vi  mapred-site.xml

<property>

    <name>mapreduce.framework.name</name>

   <value>yarn</value>

</property>

vi yarn-site.xml

<!-- 指定yarn的老大-->

<property>

    <name>yarn.resourcemanager.hostname</name>

    <value>rack1</value>

</property>

<!-- reduce 获取数据的方式 -->

<property>

     <name>yarn.nodemanager.aux-services</name>

     <value>mapreduce_shuffle</value>

</property>