Hadoop core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml在伪分布模型下、完全分布模式下配置

一、基于伪分布模式下(基于完全分布模式下)

(一)、core-site.xml

Hadoop的core-site.xml配置

<property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop1:9000</value>
</property>
<property>
        <name>hadoop.tmp.dir</name>
        <value>/export/data/hadoop-wfb-3.3.0</value> (基于伪分布模式下)
        <value>/export/data/hadoop-3.3.0</value> (基于完全分布模式下)
</property>
<property>
        <name>hadoop.http.staticuser.user</name>
        <value>root</value>
</proxyuser>
<property>
        <name>hadoop.proxyuser.root.hosts</name>
        <value>*</value>
</property>
<property>
        <name>hadoop.proxyuser.root.groups</name>
        <value>*</value>
</property>
<property>
        <name>fs.trash.interval</name>
        <value>1440</value>
</property>

各配置的作用

1. fs.defaultFS 

2. hadoop.tmp.dir



"wfb代表用户名",应该将路径中的"wfb"改为你自己的用户名。

3. hadoop.http.staticuser.user 


4.hadoop.proxyuser.root.hosts


5.hadoop.proxyuser.root.groups


(二)、hdfs-site.xml

Hadoop的hdfs-site.xml配置

<property>
        <name>dfs.replication</name>
        <value>1</value> (基于伪分布模式下)

        <value>2</value> (基于完全分布模式下)
</property>
<property>
        <name>dfs.namenode.secondary.http-address</name> 
        <value>hadoop1:9868</value> (基于伪分布模式下)
        <value>hadoop2:9868</value> (基于完全分布模式下)
</property>

各配置的作用 

1.dfs.replication


2.dfs.namenode.secondary.http-address 


(三)、mapred-site.xml

Hadoop的mapred-site.xml配置(Hadoop基于完全分布模式下)

<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
</property>
<property>
        <name>mapreduce.jobhistory.address</name>
        <value>hadoopl:10020</value>
<property>
<property>    
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>hadoopl:19888</value>
</property>
<property>
        <name>yarn.app.mapreduce.am.env</name>
        <value>HADOOP_MAPRED_HOME=/export/server/wfb-hadoop/hadoop-3.3.0</value> (基于伪分布模式下)

        <value>HADOOP_MAPRED_HOME=${HADOOP_HOE}</value> (基于完全分布模式下)
</property>
<property>
        <name>mapreduce.map.env</name>

         <value>HADOOP_MAPRED_HOME=/export/server/wfb-hadoop/hadoop-3.3.0</value> (基于伪分布模式下)
        <value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value> (基于完全分布模式下)        
</property>
<property>
        <name>mapreduce.reduce.env</name>
        <value>HADOOP_MAPRED_HOME=/export/server/wfb-hadoop/hadoop-3.3.0</value> (基于伪分布模式下)

        <value>HADOOP MAPRED HOME=${HADOOP HOME }</value> (基于完全分布模式下)        
</property>

各配置的作用 

1.mapreduce.framework.name
2.mapreduce.jobhistory.address
3.mapreduce.jobhistory.webapp.address
4.yarn.app.mapreduce.am.env

5.mapreduce.map.env

6.mapreduce.reduce.env

(四)、yarn-site.xml

Hadoop的yarn-site.xml的配置(基于伪分布模式下与基于完全分布模式下相同)

<property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoopl</value>
</property>
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
</property>
<property>
        <name>yarn.nodemanager.pmem-check-enabled</name>
        <value>false</value>
</property>
<property>
        <name>yarn.nodemanager.vmem-check-enabled</name>
        <value>false</value>
</property>
<property>
        <name>yarn.log-aggregation-enable</name>
        <value>true</value>
</property>
<property>
        <name>yarn.log.server.url</name>
        <value>http://hadoopl:19888/jobhistory/logs</value></property>
<property>
        <name>yarn.log-aggregation.retain-seconds</name>
        <value>604800</value>
</property>

各配置的作用 

1.yarn.resourcemanager.hostname
2.yarn.nodemanager.aux-services
3.yarn.nodemanager.pmem-check-enabled
4.yarn.nodemanager.vmem-check-enabled
5.yarn.log-aggregation-enable
6.yarn.log.server.url
7.yarn.log-aggregation.retain-seconds
<think>好的,我需要回答用户关于Hadoopcore-site.xml文件的默认初始配置内容的问题。首先,我得确认用户的需求是什么。用户提到想查找默认初始配置,但根据提供的引用内容,引用[1]和引用[2]中的core-site.xml配置是用户自定义的,比如设置hadoop.tmp.dir和fs.defaultFS。这可能让用户误以为这些是默认配置,但实际上Hadoop的默认配置可能不同。 接下来,我需要回忆Hadoop的默认配置。通常,Hadoop的默认配置文件在发行版的jar文件中,比如hadoop-common.jar里的core-default.xml。默认情况下,如果没有在core-site.xml中显式设置属性,Hadoop会使用这些默认值。例如,fs.defaultFS的默认值可能是file:///,表示本地文件系统,而不是HDFShadoop.tmp.dir的默认位置可能在/tmp/hadoop-${user.name},但用户示例中覆盖了这个值。 需要注意的是,用户提供的引用内容中的配置伪分布式安装时的自定义配置,并非默认配置。因此,我需要明确指出这一点,并解释默认配置和自定义配置的区别。同时,用户可能需要知道如何查看默认配置,比如通过查阅官方文档或解压jar文件查找core-default.xml。 另外,用户可能混淆了默认配置和他们看到的示例配置,所以需要明确说明两者的不同。还要提醒用户,实际应用中通常需要根据部署模式(本地、伪分布式、完全分布式)进行相应的配置覆盖,而不是依赖默认值。 最后,生成相关问题时要围绕Hadoop配置,可能涉及其他配置文件如hdfs-site.xml配置方法,以及默认配置的查找方式等。</think>Hadoop的`core-site.xml`默认初始配置内容并非显式存储在用户可见的配置文件中,而是内置于Hadoop的核心库中。用户需要通过以下两种方式查看默认配置--- ### **1. 通过Hadoop官方文档查看** Hadoop的[官方文档](https://hadoop.apache.org/docs/stable/)中会列出所有核心参数的默认值,例如: - **`fs.defaultFS`**:默认文件系统协议和地址,未配置时默认为本地文件系统`file:///` - **`hadoop.tmp.dir`**:临时目录路径,默认值为`/tmp/hadoop-${user.name}` - **`io.file.buffer.size`**:I/O缓冲区大小,默认`4096`字节 --- ### **2. 通过core-default.xml查看** Hadoop的默认配置实际存储在`hadoop-common-X.Y.Z.jar`中的`core-default.xml`文件内。查看方法: ```bash # 解压JAR文件并提取配置文件 jar xf hadoop-common-3.3.6.jar core-default.xml ``` 该文件包含所有参数的默认值,例如: ```xml <!-- 默认文件系统协议 --> <property> <name>fs.defaultFS</name> <value>file:///</value> </property> <!-- RPC通信超时时间 --> <property> <name>ipc.client.connect.timeout</name> <value>20000</value> </property> ``` --- ### **用户自定义覆盖默认值** 在伪分布式或完全分布式部署时,需在`core-site.xml`中覆盖关键参数。例如引用[1]中的配置将文件系统指向HDFS: ```xml <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

脑子不好真君

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值