关于hadoop配置文件的注解

最新推荐文章于 2024-06-28 17:02:14 发布

原创最新推荐文章于 2024-06-28 17:02:14 发布 · 3.5k 阅读

0 ·

CC 4.0 BY-SA版权

hadoop 专栏收录该内容

9 篇文章

订阅专栏

本文详细介绍了Hadoop配置文件的关键参数，包括yarn-site.xml、mapred-site.xml、hdfs-site.xml和core-site.xml，涉及ResourceManager、NodeManager、JobHistory Server、NameNode和DataNode等组件的配置，以及日志聚合、权限检查、垃圾回收和JDK路径设置等核心功能。

关于hadoop配置文件

a、yarn-site.xml
<name>yarn.nodemanager.aux-services</name>

<name>yarn.resourcemanager.hostname</name>

<name>yarn.resourcemanager.address</name>
 <name>yarn.resourcemanager.scheduler.address</name>

<name>yarn.resourcemanager.resource-tracker.address</name>

<name>yarn.resourcemanager.admin.address</name>

<name>yarn.resourcemanager.webapp.address</name>

<name>yarn.log-aggregation-enable</name>

<name>yarn.log.server.url</name>

b、mapred-site.xml
<name>mapreduce.framework.name</name>

<name>mapreduce.jobhistory.address</name>

<name>mapreduce.jobhistory.webapp.address</name>

<name>mapreduce.jobhistory.done-dir</name>

<name>mapreduce.jobhistory.intermediate-done-dir</name>

c、hdfs-site.xml
<name>dfs.namenode.name.dir</name>

<name>dfs.datanode.data.dir</name>

<name>dfs.namenode.checkpoint.dir</name>

<name>dfs.namenode.secondary.http-address</name>

<name>dfs.permissions</name>

d、core-site.xml
<name>fs.trash.interval</name>

<name>fs.defaultFS</name>

hadoop-env.sh/yarn-env.sh     Hadoop/YARN环境有关的配置
在/etc/profile中设置的是系统环境变量，记住，是系统的，最后你要被$PATH引用，那么不管是linux还是window下面，开机的时候或者调用java的相关组件的时候就会去读取PATH，但是这是系统自己的事，不是hadoop的，hadoop是独立的，所以在hadoop需要用到java的时候你需要给他指明jdk的路径
Hadoop是用JAVA编写的，没有JDK它怎么运行，所以要配置路径让它找到JDK而后运转。